WO2005041582A1 - 動画像符号化装置および動画像符号化制御方法 - Google Patents

動画像符号化装置および動画像符号化制御方法 Download PDF

Info

Publication number
WO2005041582A1
WO2005041582A1 PCT/JP2004/016472 JP2004016472W WO2005041582A1 WO 2005041582 A1 WO2005041582 A1 WO 2005041582A1 JP 2004016472 W JP2004016472 W JP 2004016472W WO 2005041582 A1 WO2005041582 A1 WO 2005041582A1
Authority
WO
WIPO (PCT)
Prior art keywords
occupancy
amount
code amount
virtual buffer
target code
Prior art date
Application number
PCT/JP2004/016472
Other languages
English (en)
French (fr)
Inventor
Kenichiro Aridome
Hironobu Miyazaki
Yukio Isobe
Original Assignee
Sony Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corporation filed Critical Sony Corporation
Priority to US10/538,086 priority Critical patent/US7835436B2/en
Priority to CN2004800017539A priority patent/CN1723709B/zh
Priority to KR20057011846A priority patent/KR101091418B1/ko
Priority to EP04793392A priority patent/EP1583365A4/en
Publication of WO2005041582A1 publication Critical patent/WO2005041582A1/ja

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44016Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving splicing one content stream with another content stream, e.g. for substituting a video clip
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/105Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/23406Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving management of server-side video buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/23424Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving splicing one content stream with another content stream, e.g. for inserting or substituting an advertisement
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44004Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving video buffer management, e.g. video decoder buffer or video display buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • H04N5/92Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/8042Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/1062Data buffering arrangements, e.g. recording or playback buffers
    • G11B2020/10675Data buffering arrangements, e.g. recording or playback buffers aspects of buffer control
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/1062Data buffering arrangements, e.g. recording or playback buffers
    • G11B2020/1075Data buffering arrangements, e.g. recording or playback buffers the usage of the buffer being restricted to a specific kind of data
    • G11B2020/10759Data buffering arrangements, e.g. recording or playback buffers the usage of the buffer being restricted to a specific kind of data content data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/84Television signal recording using optical recording
    • H04N5/85Television signal recording using optical recording on discs or drums

Definitions

  • the present invention relates to a moving picture coding apparatus for coding a moving picture signal, and more particularly to a moving picture coding apparatus for controlling a generated code amount of a subsequent chapter when performing seamless connection between the chapters, and a moving picture coding control.
  • the present invention relates to an apparatus, a moving image encoding control method, and a program for causing a computer to execute the method. Background art
  • optical disks have attracted attention as recording media capable of recording moving image (video) data and audio (audio) data.
  • This optical disc is used not only as a medium for content products such as movies, but also as a writable medium for recording on the user side.
  • the write-once media for example, the DVD-R standard, which enables recording only once in the same area, and the DVD-RW standard, which can be repeatedly rewritten, are known.
  • the DVD-Video standard for read-only discs is known, but it is also possible to perform writing in accordance with the DV-Video standard on writable media. You can do it.
  • the DVD-Video standard allows up to 99 titles per disc, and each title can contain up to 99 chapters (PTT: Part of TiTle). You can do it.
  • a DVD-R or DVD-RW with a camcorder (camera and recorder)
  • one recording unit from the start of recording to the end of recording is recorded as a cap, and a predetermined time is recorded. Recorded as the same title until the condition is met.
  • Predetermined conditions for closing the title are, for example, when a disc is ejected, when it reaches 9.9 cells in the title, or when it reaches 99 cells in the title. This is the case when moving from video recording to still image recording.
  • VBV Video Buffering Verifier: see IS013818-2 Annex C
  • Encoding must be performed so that the VBV buffer does not break down.
  • VBV buffer fails because the data of the succeeding capture is input to the VBV buffer without considering the occupancy of the preceding capture in the VBV buffer. May be caused.
  • an object of the present invention is to provide a moving picture encoding apparatus that performs seamless connection during a captive time without causing a failure in a VBV buffer. Disclosure of the invention
  • a moving picture coding apparatus (1) encodes a moving picture signal, and generates a virtual buffer defined by a generated code amount and a transferred code amount to an output destination.
  • a video encoding device that controls the encoding in accordance with the occupancy of the video signal, and determines whether seamless connection is possible between a preceding capture and a subsequent capture included in the video signal, Recording mode determining means for setting an initial value of the occupancy of the virtual buffer according to the determination result; occupancy updating means for updating the occupancy of the virtual buffer each time the encoding is performed;
  • An optimal occupancy calculating means for calculating a predetermined optimal occupancy based on the updated occupancy of the virtual buffer; and a target code amount calculating for calculating a predetermined target code amount based on the video signal of the subsequent capture.
  • a target code amount adjusting unit that adjusts the target code amount so that the total amount does not exceed the optimal occupancy amount, and an encoding unit that performs the encoding according to the adjusted target code amount.
  • the moving picture signal of the subsequent chapter is possible. Is the initial value of the virtual buffer occupancy immediately before being transferred to the virtual buffer. If the seamless connection is not possible, zero is set as the initial value of the virtual buffer occupancy. That is. As a result, when setting the initial value of the occupancy of the virtual buffer for the succeeding capture, the effect that the state of the occupancy of the virtual buffer by the preceding capture is inherited is brought about.
  • the moving picture coding apparatus in the moving picture coding apparatus according to the present invention (3), in the moving picture coding apparatus according to the above (2), when the occupancy updating means is configured such that the occupancy is larger than the transfer code, A value obtained by subtracting the transfer code amount from the occupation amount and adding the generated code amount and not exceeding the maximum value of the virtual buffer as a new occupancy amount, and when the occupation amount is equal to or less than the transfer code amount , The generated code amount is used as a new occupation amount. This has the effect of updating the information on the virtual buffer occupancy to the latest state.
  • the moving picture coding apparatus of the present invention (4) provides the moving picture coding apparatus of the above (2).
  • the optimum occupancy calculating means calculates a value which is larger or equal to the larger the occupancy of the updated virtual buffer as the optimum occupancy. This has the effect of reflecting the occupancy of the virtual buffer in the bit rate and suppressing sharp image degradation.
  • the moving picture coding control device of the present invention (5) is characterized in that the above coding is performed according to the occupation amount of a virtual buffer defined by the generated code amount and the transfer code amount to the output destination in the coding of the moving image signal.
  • a video encoding control device that controls whether or not a seamless connection is possible between a preceding chapter and a following chapter included in the video signal, and, based on the determination result, the virtual buffer Recording mode discriminating means for setting an initial value of the occupancy of the virtual buffer, occupancy updating means for updating the occupancy of the virtual buffer each time the encoding is performed, and based on the occupancy of the updated virtual buffer.
  • Optimum occupancy calculating means for calculating a predetermined optimum occupancy; target code amount calculating means for calculating a predetermined target code amount based on the video signal of the subsequent chapter; occupancy of the virtual buffer
  • Target code amount adjusting means for adjusting the target code amount so that the total amount obtained by adding the target code amount to the optimal occupancy does not exceed the optimum occupancy amount and providing the target code amount.
  • the recording mode discriminating means is capable of the above seamless connection, Evening video signal
  • the occupancy of the virtual buffer immediately before the signal is transferred to the virtual buffer is used as the initial value of the occupancy of the virtual buffer. If the seamless connection is not possible, zero is set as the initial value of the occupancy of the virtual buffer. It is a term value.
  • the moving picture coding control method according to (7) of the present invention is characterized in that the moving picture coding control method according to the occupation amount of the virtual buffer defined by the generated code amount and the transfer code amount to the output destination in the coding of the moving image signal.
  • a video encoding control method for controlling the encoding by a method comprising: determining whether seamless connection is possible between a preceding capture and a subsequent capture included in the video signal; and A procedure for setting an initial value of the occupancy of the virtual buffer according to the result; a procedure for updating the occupancy of the virtual buffer each time the encoding is performed; and an occupancy of the updated virtual buffer.
  • Calculating a predetermined optimum occupancy based on the following: a procedure for calculating a predetermined target code amount based on the video signal of the subsequent capture; and adding the target code amount to the virtual buffer occupancy. Total amount is above optimal Adjust the target amount of code so as not to exceed the amount; and a procedure to be subjected to the encoding.
  • the target code amount is calculated based on the occupation amount, and the encoding is controlled. This has the effect of making it possible to seamlessly connect the devices.
  • the moving picture coding control method of the present invention (8) is characterized in that the amount of generated codes in coding moving picture signals and the amount of transferred codes to an output destination are regulated.
  • the program according to the present invention (9) is characterized in that the above-described encoding is performed in accordance with the occupation amount of the virtual buffer defined by the generated code amount and the transfer code amount to the output destination in the encoding of the moving image signal.
  • the program according to the present invention (10) performs the above-mentioned encoding in accordance with the occupation amount of a virtual buffer defined by the generated code amount and the transfer code amount to an output destination in encoding of a moving image signal.
  • a program to be controlled a procedure for determining whether a seamless connection is possible between a preceding chapter and a subsequent chapter included in the video signal, and the result of the determination indicates that the seamless connection is possible.
  • the occupation amount of the virtual buffer immediately before the video signal of the subsequent capture is transferred to the virtual buffer is set as the initial value of the occupation amount of the virtual buffer, and the seamless connection is determined to be impossible.
  • a procedure for setting zero as an initial value of the occupancy of the virtual buffer a procedure for updating the occupancy of the virtual buffer every time the encoding is performed, and Calculating a predetermined optimal occupancy based on the occupancy of the buffer; calculating a predetermined target code based on the video signal of the subsequent capture; And adjusting the target code amount so that the total amount including the code amount does not exceed the optimum occupancy amount and providing the target code amount for the encoding.
  • FIG. 1 is a diagram showing a configuration example of a video encoding device according to an embodiment of the present invention.
  • FIG. 2 is a diagram showing a configuration example of the video encoder 100 according to the embodiment of the present invention.
  • 3A to 3B are diagrams showing a model of a VBV buffer in the MPEG-2 standard.
  • FIG. 4 is a diagram showing a transition example of the occupation amount of the encoder-side VBV buffer 701.
  • FIG. 5A to 5B are diagrams showing transition examples of the occupancy of the decoder-side VBV buffer 709.
  • FIG. 5A to 5B are diagrams showing transition examples of the occupancy of the decoder-side VBV buffer 709.
  • FIG. 6 is a diagram showing a functional configuration example of the processor 510 of the encoding control unit 500 in the embodiment of the present invention.
  • FIG. 7 is a diagram showing an example of the function VBV in the present invention.
  • FIG. 8 is a flowchart showing a processing example of the moving picture coding apparatus according to the embodiment of the present invention.
  • FIG. 9 is a flowchart showing a processing example of control on the VBV buffer according to the embodiment of the present invention.
  • FIG. 10 shows the occupancy of the VBV buffer in the embodiment of the present invention. It is a flowchart which shows the example of a process of the update of the information regarding weight.
  • FIG. 1 is a diagram showing a configuration example of a video encoding device according to an embodiment of the present invention.
  • This video encoding apparatus includes a video encoder 100 for encoding a video signal, a video encoder 200 for encoding an audio signal, a video encoder 100 and a video encoder.
  • an encoding control unit 5 0 0 that controls the encoding in 0.
  • the encoding control unit 550 includes a processor 510, a ROM 520, a RAM 530, an input / output interface 540, and a bus 550 for interconnecting these components. 0.
  • the processor 510 receives the generated code amount, which is the data amount encoded by the video encoder 100, via the signal line 179, and obtains the target data amount for encoding the next picture by using the target data amount. A quantization index that matches a certain target code amount is determined and output via signal line 159.
  • the ROM 520 is a memory that stores programs executed by the processor 510 and various parameters, and is realized by an EPROM such as a flash memory.
  • the RAM is a memory that holds work data and the like necessary for executing a program in the processor 510, and is realized by, for example, an SRAM or a DRAM.
  • Enter The output interface 540 exchanges data with the outside, and is used, for example, for updating a program in the ROM 520.
  • FIG. 2 is a diagram showing a configuration example of the video encoder 100 in the embodiment of the present invention.
  • the video encoder 1000 encodes a moving image signal input via a signal line 101 and outputs the encoded video signal via a signal line 199.
  • Conversion circuit 1 1 motion detection circuit 1 2 1, motion compensation circuit 1 2 2, subtracter 1 3 1, adder 1 3 2, DCT circuit 1 4 1, and inverse DCT circuit 1 4 2 ,
  • the reordering circuit 111 reorders the pictures of the moving image signal input via the signal line 101 in accordance with the encoding order, and supplies the reordered pictures to the scan conversion circuit 112.
  • the scan conversion circuit 112 determines whether the supplied picture data has a frame structure or a field structure, and performs a scan conversion process on the supplied picture data in accordance with the determination result. After that, it is converted into macroblock data and output to the motion detection circuit 121 and the subtractor 131, respectively.
  • the motion detection circuit 122 detects a motion vector based on the output data of the scan conversion circuit 112 and supplies the motion vector to the motion compensation circuit 122. Based on the motion vector supplied from the motion detecting circuit 122, the motion compensating circuit 122, among the image data stored in advance in the motion compensating circuit 122, sends a signal to the subtracter 133. The image data corresponding to the supplied macroblock data is read out and supplied to the subtractor 13 1 and the adder 13 2 as predicted image data. If the macroblock data supplied from the scan conversion circuit 112 is an I-picture, the subtracter 134 supplies the data directly to the DCT circuit 141, and if the macroblock data is a P-picture or a B-picture, the macroblock data is supplied. The data obtained by subtracting the predicted image data supplied from the motion compensation circuit 122 from the motion compensation circuit 122 are supplied to the DCT circuit 141.
  • the DCT circuit 141 performs DCT (Discrete Consign Transform) processing on the data supplied from the subtracter 131, and converts the data into DCT coefficients.
  • the quantization circuit 151 quantizes the DCT coefficient from the DCT circuit 141 based on the quantization index supplied from the coding control unit 500 via the signal line 159, and performs coding.
  • the encoder 16 1 performs variable-length coding on the quantized data and stores it in the buffer memory 17 1.
  • the buffer memory 171 converts the stored variable-length code into data in picture units, and outputs the data to the signal line 199 as a bit stream.
  • the generation amount of the variable length code of the entire picture is supplied as a generated code amount to the encoding control unit 500 via the signal line 179.
  • the inverse quantization circuit 152 inversely quantizes the quantized data supplied from the quantization circuit 151.
  • the inverse DCT circuit 142 performs an inverse DCT process on the data that has been inversely quantized by the inverse quantization circuit 152 and supplies the resultant data to the adder 132.
  • the adder 132 adds the data supplied from the inverse DCT circuit 142 to the predicted image data supplied from the motion compensation circuit 122 to return to the original image data. This is supplied to the motion compensation circuit 122 in order to generate predicted image data corresponding to the image data of the macroblock to be encoded.
  • FIGS. 3A to 3B are diagrams showing a model of a VBV buffer in the MPEG-2 standard.
  • the VBV buffer overflows assuming a virtual buffer called a VBV buffer between the encoder and the decoder in order to properly transmit and decode the resulting bitstream data. Encode so that it does not.
  • the difference between the amount of code generated by the encoder and the amount of code transferred to the output destination is the amount of data (referred to as “occupancy”) existing in the VBV buffer.
  • occupancy the amount of data (referred to as “occupancy”) existing in the VBV buffer.
  • the maximum size of this VBV buffer is defined as 224 KB. However, this VBV buffer is only virtual, and such a buffer does not always exist.
  • the VBV buffer 701 When the VBV buffer is viewed from the encoder side, as shown in Fig. 3A, the VBV buffer 701 is connected to the output side of the video encoder 100, and the data from the video encoder 100 to the VBV buffer 701 is transferred.
  • the transfer is theoretically instantaneous.
  • the output from the VBV buffer 701 is at the transfer rate Rmax when there is data in the VBV buffer 701, and at the transfer rate 0 when there is no data in the VBV buffer 701. It shall be performed.
  • the occupation amount of the VBV buffer 701 is grasped, and the operation of the video encoder 100 is controlled so that the occupation amount does not exceed the maximum amount of the VBV buffer 701 (so as not to overflow).
  • the VBV buffer 709 is connected to the input side of the video decoder 900 as shown in FIG. 3B, and the data from the VBV buffer 709 to the video decoder 900 is Transfer is theoretically instantaneous.
  • FIG. 4 is a diagram showing a transition example of the occupation amount of the encoder-side VBV buffer 701.
  • the vertical axis represents the occupancy of the VBV buffer, and the horizontal axis represents time.
  • the occupancy on the vertical axis is displayed in the downward direction, meaning that the occupancy increases as going downward.
  • the maximum amount of the VBV buffer 701 is 224 KB.
  • T represents the picture generation period, that is, the reciprocal of the frame rate.
  • N is an integer indicating the picture number of an arbitrary picture.
  • PX is the actual code generation amount of the Xth picture, and BX represents the occupancy of the VBV buffer immediately before the Xth picture is coded.
  • the video encoder 100 encodes the input moving image signal in the order of the picture numbers. Immediately after the 0th picture is encoded (time 0), the generated code amount P0 is instantaneously transferred to the VBV buffer 701, and the occupation amount of the VBV buffer becomes B0 + P0. Then, until the encoding of the next first picture is completed, the code is transmitted from the VBV buffer 701 at the transfer rate Rmax, and the occupancy of the VBV buffer 701 is reduced. It decreases with time.
  • the occupation amount of the VBV buffer 70 1 becomes B 1, and the first picture of the generated code amount P 1 is instantly transferred there.
  • the occupancy of the VBV buffer 70 1 becomes B 1 + P 1.
  • transfer from the VBV buffer 701 and storage of the coded picture code in the VBV buffer 701 continue immediately before the n-th picture is coded (time n XT).
  • the occupation amount of the VBV buffer 70 1 becomes 8 11 + ⁇ .
  • the occupation amount of the V ⁇ V buffer 701 becomes 0 as shown at time ⁇ ⁇ , and the data from the V ⁇ V buffer 701 becomes zero. Overnight transmission is not performed.
  • the V ⁇ ⁇ ⁇ V buffer 701 generates an underflow on the encoder side.
  • overflow of the VBV buffer 701 is not allowed. Therefore, it is necessary to control the video encoder 100 so that the V ⁇ V buffer 701 does not overbuff.
  • FIG. 5 to 5 are diagrams showing transition examples of the occupancy of the decoder-side VBV buffer 709.
  • the vertical axis represents the occupancy of the VBV buffer, and the horizontal axis represents time. Unlike Fig. 4, the occupancy on the vertical axis is displayed upward, meaning that the occupancy increases as it goes upward.
  • This V ⁇ V buffer 709 stores the code at the transfer rate R max in a state where the video stream exists in the bit stream. No storage is performed if no video stream exists during the bitstream.
  • the outflow from the VBV buffer 709 to the video decoder 900 is instantaneously performed at the start of decoding of each picture.
  • the code of the following capture flows in before the occupancy of the VBV buffer 709 by the previous chapter becomes zero. Therefore, it is necessary to calculate the initial value of the VBV buffer 709 by taking over the occupation amount of the VBV buffer 709 by the preceding capture. If the flow of codes generated in the subsequent capture is started at the stage where the occupation amount of the VBV buffer 709 by the preceding chapter remains large, the VBV buffer 709 may overflow.
  • the VBV buffer 709 may underflow.
  • the code amount required to decode the first picture (I 2) in the subsequent capture is instantaneously extracted
  • the VBV buffer 709 does not have enough code, Does not have the data necessary for decoding, so seamless connection is no longer possible.
  • the In order to accumulate a sufficient amount of codes in advance it is necessary to start the bitstream transfer of the subsequent capture as soon as possible, but after the transfer of the previous capture is completed, the transfer of the bitstream is completed. This is also limited by the restriction that a transfer must be initiated.
  • the code amount generated in the subsequent capture time is limited as follows. Perform encoding. Note that since the VBV buffers 701 and 709 described above have a two-sided relationship, the following description will be made on the assumption that the VBV buffer 701 is used.
  • FIG. 6 is a diagram showing a functional configuration example of the processor 510 of the encoding control unit 500 in the embodiment of the present invention.
  • This functional configuration example includes a recording mode discriminating unit 5 11, an occupation amount updating unit 5 12, an optimal occupying amount calculating unit 5 13, a target code amount calculating unit 5 14, and a target code amount adjusting unit. It comprises a unit 5 15 and a quantization index determining unit 5 16. Note that in this example, it is assumed that the processor 510 implements each function according to the program stored in the ROM 520, but these functions may be implemented by hardware. Good.
  • the recording mode determination unit 511 determines whether seamless connection between the chapters is possible.
  • the conditions for a seamless connection are that the subsequent capture for seamless connection is not the first capture of the title to which it belongs, the last V ⁇ B of the previous capture is not less than 1.5 seconds in playback time, That the seek time caused by the placement of the target is within the allowable range.
  • the presence / absence of the seamless connection determined by the recording mode determination unit 5 11 is determined by the PG of VTSI (Video Title Set Information) in the data storage area of the DVD. This is reflected in the seamless playback flag in the C—PBIT (Cell PlayBack Information Table) in the CI (ProGram Chain Information) fc. That is, the seamless playback flag of the succeeding chapter is set to ON when a seamless connection is performed, and the seamless playback flag of the subsequent capture is set to OFF when the seamless connection is not performed. .
  • the recording mode determination unit 511 determines the occupancy immediately before the VBV buffer stored in the RAM 530 (or ROM 520) by the VBV buffer. Set as the initial value of. On the other hand, if it is determined that seamless connection is not possible, zero is set as the initial value of the VBV buffer.
  • the initial value of the VBV buffer corresponds to the occupation amount “B 0” in FIG. The initial value of the VBV buffer set in this way is supplied to the occupancy update unit 512.
  • the occupancy update unit 512 updates the occupancy of the VBV buffer based on the generated code amount supplied from the buffer memory 171 of the video encoder 100. For example, if “B 0 + P 0” in FIG. 4 is the immediately preceding timing, the transfer code amount from “B 0 + P 0” to “B 1” is reduced, and the generated code amount “P 1” Add.
  • the transfer rate Rmax is 9.3 Mbps and that the NTSC (National Television Standards Committee) system is used as the screen system, the frame frequency of NTSC is
  • the optimal occupancy calculation unit 513 calculates the optimal occupancy of the VBV buffer when the next picture is coded.
  • BX means the usage of the VBV buffer before encoding the Xth picture
  • By means the optimal occupancy of the VBV buffer after encoding the Xth picture.
  • B y V B V (B X) is a monotone increasing function for B X in the interval [0, B max] of B x.
  • Feature 3 If B x ⁇ B th, ⁇ VBV (BX) one (R max XT) ⁇ ⁇ B x, and if B x> B th, ⁇ VBV (BX) one (Rmax XT) ⁇ ⁇ B x.
  • FIG. 7 shows an example of a VBV function having the above three features.
  • B y is constant at a predetermined value (a value equal to or greater than B th) when BX is [0, B th], and B y is constant when BX is [B th, B ma]. Increase gradually at a rate of less than 1.
  • the optimal occupancy calculation unit 5 13 supplies the optimal occupancy of the VBV buffer obtained in this way to the target code amount adjustment unit 5 15.
  • the target code amount calculator 514 calculates a target code amount based on a moving image signal of a subsequent chapter for performing seamless connection.
  • Various models have been proposed for calculating the target code amount.
  • the well-known TM5 system is assumed as an example.
  • This TM5 system has been proposed as a model for controlling the amount of code of MPEG-2 (see ISO / IEC JTC1 / SC29 / G11, MPEG93 / 457, "Test Model 5," 1993.)
  • the distribution of the code amount is determined according to the picture type.
  • the target code amount adjuster 5 15 refers to the target code amount calculated by the target code amount calculator 5 14 and the optimal occupancy calculated by the optimal occupancy calculator 5 13, Determine whether the sum of the current occupancy and the target code amount exceeds the optimal occupancy. If it exceeds, the target code amount is adjusted so that the value obtained by subtracting the current occupancy from the optimal occupancy becomes the target code amount.
  • the target code amount adjusted in this way is calculated by the quantization index determination unit 5 16 Supplied to
  • the quantization index determination unit 5 16 sets the quantization characteristic in the quantization circuit 15 1 so that the generated code amount in the video encoder 100 becomes the target code amount supplied from the target code amount adjustment unit 5 15. Determine the quantization index corresponding to the value. This quantization index is supplied to the quantization circuit 15 1 via the signal line 159.
  • FIG. 8 is a flowchart showing a processing example of the moving picture coding apparatus according to the embodiment of the present invention.
  • the recording mode determining unit 511 determines whether or not to perform seamless connection as the recording mode (step S901). If a seamless connection is to be made (step S 902), the occupancy immediately before the VBV buffer held in RAM 530 (or ROM 520) is set as the initial value of the VBV buffer. (Step S903). On the other hand, when the seamless connection is not performed (step S902), zero is set as the initial value of the VBV buffer (step S904).
  • FIG. 9 is a flowchart showing a processing example of control (step S906) on the VBV buffer in the embodiment of the present invention. As is clear from Fig. 8, the control for the VBV buffer is executed every time one picture (frame) of encoding is performed.
  • the occupancy update unit 511 updates the information on the occupancy of the VBV buffer (step S911). As a result, the occupation amount of the VBV buffer immediately after encoding is grasped. The details of this processing will be described later with reference to FIG.
  • the optimal occupancy calculating unit 513 calculates the optimal occupancy of the VBV buffer after the next encoding (step S911). This optimal occupancy can be calculated by, for example, the above-described VBV function. Further, the target code amount calculation section 514 calculates a target code amount in the next code (step S913). This target code amount can be calculated by, for example, the known T M.5 method.
  • the target code amount adjustment unit 515 calculates the value obtained by adding the current occupation amount of the VBV buffer determined in step S911 and the target code amount calculated in step S913 to step S911. It is determined whether or not the optimum occupancy calculated in 9 12 has been exceeded (step S 9 14). If so, the value obtained by subtracting the current occupancy from the optimum occupancy is calculated as the target code amount. (Step S915).
  • the quantization index determining unit 516 determines the quantization index (step S 916). This quantization index is It is supplied to the quantization circuit 15 1 of 0 0.
  • FIG. 10 is a flowchart showing a processing example of updating information (step S911) on the occupancy of the VBV buffer according to the embodiment of the present invention.
  • the transfer code amount for one cycle is subtracted from the immediately preceding occupation amount in the VBV buffer.
  • the occupation amount before the subtraction is compared with the transfer code amount for one cycle (30.131 K bits in the above example) (step S921), and the occupation amount before the subtraction is calculated. If it is larger, the result of the subtraction becomes the new occupancy (step S922), otherwise the VBV buffer underflows and the new occupancy becomes zero (step S922).
  • the generated code amount in the video encoder 100 is further added to the new occupation amount (step S9224). If the occupied amount after this addition exceeds the maximum amount of the VBV buffer (step S925), an overflow will occur and the new occupied amount will be the maximum amount of the VBV buffer (step S926). ).
  • the recording mode determining unit 511 determines whether or not to perform the seamless connection during the capture time, and the initial value of the VBV buffer is determined in advance based on the determination result.
  • the embodiment of the present invention is an example for embodying the present invention, and has a correspondence relationship with the invention-specifying matters in the claims as described below, but is not limited thereto.
  • the virtual buffer corresponds to, for example, the VBV buffer 70 1.
  • the recording mode determining means corresponds to, for example, the recording mode determining unit 5 11.
  • the occupancy update unit corresponds to, for example, the occupancy update unit 512.
  • the optimal occupancy calculation means corresponds to, for example, the optimal occupancy calculation unit 5 13.
  • the target code amount calculation means corresponds to, for example, the target code amount calculation section 514.
  • the target code amount adjusting means corresponds to, for example, the target code amount adjustment section 5 15.
  • the encoding means corresponds to, for example, the video encoder 100.
  • the virtual buffer corresponds to, for example, the VBV buffer 701.
  • the recording mode determining means corresponds to, for example, the recording mode determining unit 511.
  • the occupancy update means corresponds to, for example, the occupancy update unit 5 12.
  • the optimum occupancy calculating means corresponds to, for example, the optimum occupancy calculating unit 5 13.
  • the target code amount calculating means corresponds to, for example, the target code amount calculating section 514.
  • the virtual buffer corresponds to, for example, the VBV buffer 70 1.
  • the procedure for determining whether seamless connection is possible between the preceding chapter and the following chapter included in the video signal corresponds to, for example, step S910.
  • the procedure for setting the initial value of the occupation amount of the virtual buffer according to the determination result corresponds to, for example, steps S 902 to S 904.
  • the procedure for updating the occupancy of the virtual buffer every time encoding is performed corresponds to, for example, step S911.
  • the procedure for calculating the predetermined optimum occupancy based on the updated occupancy of the virtual buffer corresponds to, for example, step S ⁇ b> 912.
  • a procedure for calculating a predetermined target code amount based on a moving image signal of a subsequent chapter is an example. For example, it corresponds to step S 9 13.
  • the procedure for adjusting the target code amount so that the total amount obtained by adding the target code amount to the occupation amount of the virtual buffer does not exceed the optimum occupancy amount and performing encoding corresponds to, for example, steps S914 and S915. I do.
  • the virtual buffer corresponds to, for example, the VBV buffer 701.
  • the procedure for determining whether seamless connection is possible between the preceding chapter and the following chapter included in the moving image signal corresponds to, for example, step S910. If it is determined that seamless connection is possible in the above determination result, the occupancy of the virtual buffer immediately before the moving image signal of the subsequent capture is transferred to the virtual buffer is set as the initial value of the occupancy of the virtual buffer, and the seamless
  • the procedure of setting zero as the initial value of the occupation amount of the virtual buffer when it is determined that the connection is not possible corresponds to, for example, steps S902 to S904.
  • the procedure for updating the occupancy of the virtual buffer each time encoding is performed corresponds to, for example, step S911.
  • the procedure for calculating the predetermined optimal occupancy based on the updated occupancy of the virtual buffer corresponds to, for example, step S912.
  • the procedure for calculating the predetermined target code amount based on the moving picture signal of the subsequent capture corresponds to, for example, step S913.
  • the procedure for adjusting the target code amount so that the total amount obtained by adding the target code amount to the occupation amount of the virtual buffer does not exceed the optimum occupancy amount and providing the coding is described in, for example, steps S914 and S915. Corresponding.
  • processing procedure described in the embodiment of the present invention may be regarded as a method having a series of these procedures, and a program or a program for causing a computer to execute the series of procedures. May be regarded as a recording medium for storing the information.
  • the present invention can be applied to, for example, encoding a moving image signal into an MPEG-2 format and writing the encoded signal to a DVD.

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Algebra (AREA)
  • Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

 VBVバッファに破綻をきたさずにチャプタ間のシームレス接続を行うことができる動画像符号化装置である。動画像信号に含まれる先行チャプタと後続チャプタとの間におけるシームレス接続の判別結果に応じて仮想バッファの占有量の初期値を設定する記録モード判別手段と、上記仮想バッファの占有量を更新する占有量更新手段と、上記更新された仮想バッファの占有量に基づいて所定の最適占有量を算出する最適占有量算出手段と、上記後続チャプタの動画像信号に基づいて所定の目標符号量を算出する目標符号量算出手段と、上記仮想バッファの占有量に上記目標符号量を加えた総量が上記最適占有量を越えないように上記目標符号量を調整する目標符号量調整手段と、上記調整された目標符号量に従って上記符号化を行う符号化手段とを具備する。

Description

明細書 動画像符号化装置および動画像符号化制御方法 技術分野
本発明は、 動画像信号の符号化を行う動画像符号化装置に関し、 特にチヤプタ間のシームレス接続を行う際に後続チヤプタの発 生符号量を制御する動画像符号化装置、 動画像符号化制御装置、 および、 動画像符号化制御方法ならびに当該方法をコンピュータ に実行させるプログラムに関する。 背景技術
近年、 動画像 (ビデオ) データや音声 (オーディオ) デ一夕を 記録できる記録媒体として光ディスクが注目されている。 この光 ディスクは、 映画などのコンテンツ商品のメディアとして けで なく、 ユーザ側で記録を行うための書き込み型メディアとしても 用いられるようなつている。 書き込み型メディ アとしては、 例え ば、 同一領域について一度だけの記録を可能とした D VD— R規 格や、 繰り返し書き換え可能な D V D— RW規格などが知られて いる。 これら光メディアのファイルフォーマッ トとしては、 再生 専用ディスクのための D V D— V i d e o規格が知られている が、 書き込み型メディアに対してもこの D VD— V i d e o規格 に準拠した書き込みを行う ことができるようになつている。
D V D - V i d e o規格では、 一つのディスク当たり最 9 9 のタイ トルを記録できるようになつており、 さらに各タイ 卜リレは 最大 9 9のチャプター ( P T T : Part of TiTle) を含むこ とが できるようになつている。 上述の D V D— Rや D V D— RWに対 してカムコーダ (camcorder: camera and recorder) により記録 を行う場合、 記録開始から記録終了までの 1 回の記録単位がチヤ プ夕一として記録され、 所定の条件を満たすまで同一のタイ トル として記録される。 タイ トルを閉じる所定の条件とは、 例えば、 ディスクがイジェク ト (排出) された場合、 タイ トル内で 9 9チ ャプ夕一に達した場合、 タイ トル内で 9 9セルに達した場合、 動 画記録から静止画記録に移行した場合などである。
このようにチャプター単位で記録されたデータを再生すると、 チヤプタ間に微妙な隙間が生じてしまい、 一瞬途切れたような表 示が行われしまう。 カムコーダにおける記録単位は十数秒から数 十秒程度が標準的であり、 その度に再生が途切れてしまうのは望 ましくない。
そのため、 従来より、 ビデオス トリーム間を見た目として途切 れないよう に接続するシームレス接続の技術が提案されている (例えば、特開平 1 1 一 1 5 5 1 3 1号公報(第 2 5図)参照。)。 上述の従来技術では、 ビデオオブジェク トの部分区間同士の連 結をする際に、 その部分区間の終端部に位置するピクチャデータ を含む V O B Uと、 先端部に位置するピクチャデータを含む V O B Uとを光ディスクから読み出して、 V O B Uを複数のオーディ ォパックと、 複数のビデオパックとに分離させ、 その後、 ビデオ パックを再エンコードして、 複数のオーディオパックのうち一部 を後部区間に多重化している。 すなわち、 出力ス ト リームの多重 化をやり直す必要が生じる。
一方、 D V D— V i d e o規格に準拠した記録を行うために動 画像のエンコード (符号化) を行う際には M P E G— 2 (Moving Picture Experts Group phase 2) 規格が用いられるが、 この M P E G— 2では、 エンコーダとデコーダとの間に V B V (Video Buffering Verifier : IS013818-2 Annex C参照) バッファ と呼 ばれる仮想バッファを想定して、 この V B Vバッファが破綻しな いようにエンコードを行う必要がある。 別々にエンコードされた ビデオス トリーム同士をシームレス接続しょう とすると、 この V B Vバッファにおける先行チヤプ夕の占有量が考慮されずに後 続チヤプ夕のデータが V B Vバッファに入力されるため、 この V B Vバッファに破綻をきたすおそれがある。
そこで、 本発明は、 V B Vバッファに破綻をきたさずにチヤプ 夕間のシームレス接続を行う動画像符号化装置を提供すること を目的とする。 発明の開示
上記課題を解決するために本発明( 1 )の動画像符号化装置は、 動画像信号を符号化し、 その発生符号量と出力先への転送符号量 とによ り規定される仮想バッ フ ァの占有量に応じて上記符号化 を制御する動画像符号化装置であって、 上記動画像信号に含まれ る先行チヤプ夕と後続チヤプ夕との間でシームレス接続が可能 か否を判別し、 当該判別結果に応じて上記仮想バッファの占有量 の初期値を設定する記録モー ド判別手段と、 上記符号化が行われ るたびに上記仮想バッファの占有量を更新する占有量更新手段 と、 上記更新された仮想バッファの占有量に基づいて所定の最適 占有量を算出する最適占有量算出手段と、 上記後続チヤプ夕の動 画像信号に基づいて所定の目標符号量を算出する目標符号量算 出手段と、 上記仮想バッファの占有量に上記目標符号量を加えた 総量が上記最適占有量を超えないように上記目標符号量を調整 する目標符号量調整手段と、 上記調整された目標符号量に従って 上記符号化を行う符号化手段とを具備する。 これにより、 仮想バ ッファの占有量の初期値を設定した上でその占有量に基づいて 目標符号量を算出して符号化を行うため、 仮想バッファに破綻を きたさずにチヤプタ間のシームレス接続を行う ことができると いう作用をもたらす。
また、 本発明 ( 2 ) の動画像符号化装置は、 前記 ( 1 ) の動画 像符号化装置において、 上記記録モード判別手段が、 上記シーム レス接続が可能であれば上記後続チヤプタの動画像信号が上記 仮想バッファに転送される直前の上記仮想バッファの占有量を 上記仮想バッファの占有量の初期値とし、 上記シームレス接続が 不可能であればゼロを上記仮想バッ ファの占有量の初期値とす るものである。 これにより、 後続チヤプ夕のための仮想バッファ の占有量の初期値を設定するにあたって、 先行チヤプタによる仮 想バッ ファの占有量の状態を引き継がせるという作用をもたら す。
また、 本発明 ( 3 ) の動画像符号化装置は、 前記 ( 2 ) の動画 像符号化装置において、 上記占有量更新手段が、 上記占有量が上 記転送符号量よ り多い場合には上記占有量から上記転送符号量 を減じて上記発生符号量を加えた値であって上記仮想バッファ の最大値を超えない値を新たな占有量とし、 上記占有量が上記転 送符号量以下の場合には上記発生符号量を新たな占有量とする ものである。 これにより、 仮想バッファの占有量に関する情報を 最新の状態に更新させるという作用をもたらす。
また、 本発明 ( 4 ) の動画像符号化装置は、 前記 ( 2 ) の動画 像符号化装置において、 上記最適占有量算出手段が、 上記更新さ れた仮想バッ フ ァの占有量が大きいほど大きいもしく は等しい 値を上記最適占有量として算出するものである。 これにより、 仮 想バッファの占有量をビッ ト レー 卜に反映させて急峻な画像劣 化を抑制するという作用をもたらす。
また、 本発明 ( 5 ) の動画像符号化制御装置は、 動画像信号の 符号化における発生符号量と出力先への転送符号量とにより規 定される仮想バッファの占有量に応じて上記符号化を制御する 動画像符号化制御装置であって、 上記動画像信号に含まれる先行 チヤプタと後続チヤプ夕との間でシームレス接続が可能か否を 判別し、 当該判別結果に応じて上記仮想バッファの占有量の初期 値を設定する記録モード判別手段と、 上記符号化が行われるたび に上記仮想バッファの占有量を更新する占有量更新手段と、 上記 更新された仮想バッファの占有量に基づいて所定の最適占有量 を算出する最適占有量算出手段と、 上記後続チヤプタの動画像信 号に基づいて所定の目標符号量を算出する目標符号量算出手段 と、 上記仮想バッファの占有量に上記目標符号量を加えた総量が 上記最適占有量を超えないように上記目標符号量を調整して上 記符号化に供する目標符号量調整手段とを具備する。 これにより、 仮想バッ フ ァの占有量の初期値を設定した上でその占有量に基 づいて目標符号量を算出して符号化を制御するため、 仮想バッフ ァに破綻をきたさずにチヤプタ間のシームレス接続を行う こと ができるという作用をもたらす。
また、 本発明 ( 6 ) の動画像符号化制御装置は、 前記 ( 2 ) の 動画像符号化制御装置において、 上記記録モード判別手段が、 上 記シ一ムレス接続が可能であれば上記後続チヤプ夕の動画像信 号が上記仮想バッファに転送される直前の上記仮想バッファの 占有量を上記仮想バッファの占有量の初期値とし、 上記シームレ ス接続が不可能であればゼロを上記仮想バッフ ァの占有量の初 期値とするものである。 これにより、 後続チヤプ夕のための仮想 ノ ッファの占有量の初期値を設定するにあたって、 先行チヤプタ による仮想バッファの占有量の状態を引き継がせるという作用 をもたらす。
また、 本発明の ( 7 ) の動画像符号化制御方法は、 動画像信号 の符号化における発生符号量と出力先への転送符号量とによ り 規定される仮想バッフ ァの占有量に応じて上記符号化を制御す る動画像符号化制御方法であって、 上記動画像信号に含まれる先 行チヤプ夕と後続チヤプタとの間でシームレス接続が可能か否 を判別する手順と、 上記判別結果に応じて上記仮想バッファの占 有量の初期値を設定する手順と、 上記符号化が行われるたびに上 記仮想バッファの占有量を更新する手順と、 上記更新された仮想 バッファの占有量に基づいて所定の最適占有量を算出する手順 と、 上記後続チヤプ夕の動画像信号に基づいて所定の目標符号量 を算出する手順と、 上記仮想バッファの占有量に上記目標符号量 を加えた総量が上記最適占有量を超えないよう に上記目標符号 量を調整して上記符号化に供する手順とを具備する。 これにより、 仮想バッ フ ァの占有量の初期値を設定した上でその占有量に基 づいて目標符号量を算出して符号化を制御するため、 仮想バッフ ァに破綻をきたさずにチヤプタ間のシームレス接続を行う こと ができるという作用をもたらす。
また、 本発明 ( 8 ) の動画像符号化制御方法は、 動画像信号の 符号化における発生符号量と出力先への転送符号量とによ り規 定される仮想バッファの占有量に応じて上記符号化を制御する 動画像符号化制御方法であって、 上記動画像信号に含まれる先行 チヤプ夕と後続チヤプ夕との間でシームレス接続が可能か否を 判別する手順と、 上記判別結果において上記シームレス接続が可 能と判別された場合には上記後続チヤプタの動画像信号が上記 仮想バッファに転送される直前の上記仮想バッファの占有量を 上記仮想バッファの占有量の初期値とし、 上記シームレス接続が 不可能と判別された場合にはゼロを上記仮想バッ フ ァの占有量 の初期値とする手順と、 上記符号化が行われるたびに上記仮想バ ッファの占有量を更新する手順と、 上記更新された仮想バッファ の占有量に基づいて所定の最適占有量を算出する手順と、 上記後 続チヤプ夕の動画像信号に基づいて所定の目標符号量を算出す る手順と、 上記仮想バッファの占有量に上記目標符号量を加えた 総量が上記最適占有量を超えないように上記目標符号量を調整 して上記符号化に供する手順とを具備する。 これにより、 後続チ ャプ夕のための仮想バッ フ ァの占有量の初期値を設定するにあ たって、 先行チヤプ夕による仮想バッファの占有量の状態を引き 継がせるという作用をもたらす。
また、 本発明 ( 9 ) のプログラムは、 動画像信号の符号化にお ける発生符号量と出力先への転送符号量とによ り規定される仮 想バッファの占有量に応じて上記符号化を制御するプログラム であって、 上記動画像信号に含まれる先行チヤプタと後続チヤプ 夕との間でシームレス接続が可能か否を判別する手順と、 上記判 別結果に応じて上記仮想バッフ ァの占有量の初期値を設定する 手順と、 上記符号化が行われるたびに上記仮想バッファの占有量 を更新する手順と、 上記更新された仮想バッファの占有量に基づ いて所定の最適占有量を算出する手順と、 上記後続チヤプ夕の動 画像信号に基づいて所定の目標符号量を算出する手順と、 上記仮 想バッ フ ァの占有量に上記目標符号量を加えた総量が上記最適 占有量を超えないよう に上記目標符号量を調整して上記符号化 に供する手順とをコンピュータに実行させるものである。 これに より、 仮想バッファの占有量の初期値を設定した上でその占有量 に基づいて目標符号量を算出して符号化を制御するため、 仮想バ ッファに破綻をきたさずにチヤプタ間のシームレス接続を行う ことができるという作用をもたらす。
また、 本発明 ( 1 0 ) のプログラムは、 動画像信号の符号化に おける発生符号量と出力先への転送符号量とによ り規定される 仮想バッファの占有量に応じて上記符号化を制御するプロダラ ムであって、 上記動画像信号に含まれる先行チヤプタと後続チヤ プタとの間でシームレス接続が可能か否を判別する手順と、 上記 判別結果において上記シームレス接続が可能と判別された場合 には上記後続チヤプ夕の動画像信号が上記仮想バッファに転送 される直前の上記仮想バッファの占有量を上記仮想バッファの 占有量の初期値とし、 上記シームレス接続が不可能と判別された 場合にはゼロを上記仮想バッファの占有量の初期値とする手順 と、 上記符号化が行われるたびに上記仮想バッファの占有量を更 新する手順と、 上記更新された仮想バッファの占有量に基づいて 所定の最適占有量を算出する手順と、 上記後続チヤプ夕の動画像 信号に基づいて所定の目標符号量を算出する手順と、 上記仮想バ ッファの占有量に上記目標符号量を加えた総量が上記最適占有 量を超えないように上記目標符号量を調整して上記符号化に供 する手順とをコンピュータに実行させるものである。 これにより、 後 チャプ夕のための仮想バッファの占有量の初期値を設定す るにあたつて、 先行チヤプタによる仮想バッ ファの占有量の状態 を引き継がせるという作用をもたらす。
本発明によれば、 V B Vバッファに破綻をきたさずにチヤプ夕 間のシ ―ムレス接続を行う ことができるという優れた効果を奏 し得る 図面の簡単な説明
第 1図は、 本発明の実施の形態における動画像符号化装置の構 成例を示す図である。
第 2図は、 本発明の実施の形態におけるビデオエンコーダ 1 0 0の構成例を示す図である。
第 3 A図乃至第 3 B図は、 M P E G— 2規格における V B Vバ ッファのモデルを示す図である。
第 4図は、 エンコーダ側 V B Vバッファ 7 0 1 の占有量の遷移 例を示す図である。
第 5 A図乃至第 5 B図は、 デコーダ側 V B Vバッファ 7 0 9の 占有量の遷移例を示す図である。
第 6図は、 本発明の実施の形態における符号化制御部 5 0 0の プロセッサ 5 1 0の機能構成例を示す図である。
第 7図は、 本発明における関数 V B Vの一例を示す図である。 第 8図は、 本発明の実施の形態における動画像符号化装置の処 理例を示す流れ図である。
第 9図は、 本発明の実施の形態における V B Vバッファに関す る制御の処理例を示す流れ図である。
第 1 0図は、 本発明の実施の形態における V B Vバッファの占 有量に関する情報の更新の処理例を示す流れ図である。 発明を実施するための最良の形態
次に本発明の実施の形態について図面を参照して詳細に説明 する。
第 1 図は、 本発明の実施の形態における動画像符号化装置の構 成例を示す図である。 この動画像符号化装置は、 動画像信号を符 号化するビデオエンコーダ 1 0 0 と、 音声信号を符号化するォ一 ディォエンコーダ 2 0 0 と、 ビデオエンコーダ 1 0 0およびォ一 ディ ォエンコーダ 2 0 0 の出力を多重化するマルチプレクサ 3 0 0 と、 マルチプレクサ 3 0 0 により多重化されたス ト リームデ —夕を記録媒体 4 9 0に記録する媒体記録部 4 0 0 と、 ビデオェ ンコーダ 1 0 0 における符号化を制御する符号化制御部 5 0 0 とを備えている。
符号化制御部 5 0 0は、プロセッサ 5 1 0 と、 R OM 5 2 0 と、 R AM 5 3 0 と、 入出力インターフエ一ス 5 4 0 と、 これらを相 互に接続するバス 5 5 0 とを備えている。 プロセッサ 5 1 0は、 ビデオエンコーダ 1 0 0 において符号化されたデ一夕量である 発生符号量を信号線 1 7 9によって受け取り、 次のピクチャを符 号化する際の目標デ一夕量である目標符号量に合致した量子化 インデックスを決定して信号線 1 5 9 により出力する。 R OM 5 2 0は、 プロセッサ 5 1 0により実行されるプログラムや各種パ ラメ一夕等を保持するメモリであり、 例えば、 フラッシュメモリ 等の E P R OMにより実現される。 R AMは、 プロセッサ 5 1 0 におけるプログラム実行に必要な作業データを等を保持するメ モリであり、 例えば S R AMや D R AM等により実現される。 入 出力インターフェース 5 4 0は、 外部とのデータのやり取りを行 うものであり、 例えば、 R O M 5 2 0内のプログラムを更新する 等のために使用される。
第 2図は、 本発明の実施の形態におけるビデオエンコーダ 1 0 0 の構成例を示す図である。 このビデオエンコーダ 1 0 0は、 信 号線 1 0 1 を介して入力された動画像信号を符号化して信号線 1 9 9 を介して出力するものであり、 並べ替え回路 1 1 1 と、 走 查変換回路 1 1 2 と、 動き検出回路 1 2 1 と、 動き補償回路 1 2 2 と、 減算器 1 3 1 と、 加算器 1 3 2 と、 D C T回路 1 4 1 と、 逆 D C T回路 1 4 2 と、 量子化回路 1 5 1 と、 逆量子化回路 1 5 2 と、符号化器 1 6 1 と、バッファメモリ 1 7 1 とを備えている。 並べ替え回路 1 1 1は、 信号線 1 0 1 を介して入力された動画 像信号の各ピクチャを符号化の順序に従って並べ替えて走査変 換回路 1 1 2 に供給する。 走査変換回路 1 1 2は、 供給されたピ クチャのデータがフレーム構造であるかフィールド構造である かを判別し、 供給されたピクチャのデータに対して判別結果に対 応した走査変換の処理を施した後にマクロブロックのデータに マク ロブロック化して動き検出回路 1 2 1および減算器 1 3 1 にそれぞれ出力する。
動き検出回路 1 2 1 は、 走査変換回路 1 1 2 の出力データに基 づいて、 動きベク トルを検出して動き補償回路 1 2 2 に供給する。 動き補償回路 1 2 2は、 動き検出回路 1 2 1から供給された動き べク トルに基づいて、 動き補償回路 1 2 2内に予め記憶されてい る画像データのうち、 減算器 1 3 1 に供給されたマクロブロック のデータに対応する画像データを読み出し、 予測画像データとし て減算器 1 3 1および加算器 1 3 2 に供給する。 減算器 1 3 1 は、 走査変換回路 1 1 2から供給されたマクロブ ロックのデータが I ピクチャであればそのまま D C T回路 1 4 1 に供給し、 P ピクチャまたは Bピクチャであればそのマクロブ ロックのデータから動き補償回路 1 2 2 よ り供給された予測画 像データを減算したデ一夕を D C T回路 1 4 1 に供給する。
D C T回路 1 4 1 は、 減算器 1 3 1から供給されたデータに対 して D C T (Discrete Consign Transform : 離散コサイン変換) 処理を施して D C T係数に変換する。 量子化回路 1 5 1 は、 D C T回路 1 4 1からの D C T係数を、 符号化制御部 5 0 0から信号 線 1 5 9 によ り供給された量子化インデックスに基づいて量子 化して、 符号化器 1 6 1および逆量子化回路 1 5 2 に供給する。 符号化器 1 6 1 は、 量子化されたデータを可変長符号化してバッ ファメモリ 1 7 1 に格納する。 ノ ッファメモリ 1 7 1 は、 格納さ れた可変長符号をピクチャ単位のデータに変換し、 ビッ トス 卜リ 一ムデ一夕として信号線 1 9 9に出力する。 また、 ピクチャ全体 の可変長符号の発生量を発生符号量として信号線 1 7 9 によ り 符号化制御部 5 0 0 に供給する。
逆量子化回路 1 5 2は、 量子化回路 1 5 1から供給された量子 化されたデータを逆量子化する。 逆 D C T回路 1 4 2は、 逆量子 化回路 1 5 2 によ り逆量子化されたデ一夕に逆 D C T処理を施 して加算器 1 3 2 に供給する。 加算器 1 3 2は、 逆 D C T回路 1 4 2から供給されたデータと動き補償回路 1 2 2から供給され た予測画像データとを加算して元の画像データに戻し、 これを、 次以降に符号化されるマクロブロックの画像データに対応する 予測画像データを生成するために動き補償回路 1 2 2 に供給す る。 第 3 A図乃至第 3 B図は、 M P E G— 2規格における V B Vバ ッファのモデルを示す図である。 M P E G— 2規格では、 得られ るビッ トス トリームデ一夕を適切に伝送し、 復号するために、 ェ ンコーダとデコーダとの間に V B Vバッファ と呼ばれる仮想バ ッファを想定して、 この V B Vバッファがオーバフローしないよ うにエンコードを行う。 エンコーダによる発生符号量と出力先へ の転送符号量との差異が、 この V B Vバッファ内に存在するデ一 タ量 (「占有量」 という。) となる。 この V B Vバッファの最大量 は 2 2 4 K B と定義されている。 但し、 この V B Vバッファはあ くまでも仮想的なものであり、 実際にそのようなバッファが存在 するとは限らない。
V B Vバッファをエンコーダ側から見ると、 第 3 A図のように ビデオエンコーダ 1 0 0 の出力側に V B Vバッファ 7 0 1が接 続され、 ビデオエンコーダ 1 0 0から V B Vバッファ 7 0 1への データの転送は理論上、 瞬時に行われるものとする。 そして、 V B Vバッファ 7 0 1からの出力は、 V B Vバッファ 7 0 1 にデ一 夕が存在する場合には転送速度 Rm a xで、 V B Vバッファ 7 0 1 にデータが存在しない場合には転送速度 0で行われるものと する。 これにより、 V B Vバッファ 7 0 1 の占有量を把握し、 こ の占有量が V B Vバッファ 7 0 1 の最大量を上回らないように (オーバフローしないように) ビデオエンコーダ 1 0 0の動作を 制御する。
一方、 V B Vバッファをデコーダ側から見ると、 第 3 B図のよ うにビデオデコーダ 9 0 0 の入力側に V B Vバッファ 7 0 9が 接続され、 V B Vバッファ 7 0 9からビデオデコーダ 9 0 0への データの転送は理論上、 瞬時に行われるものとする。 そして、 V B Vバッファ 7 0 9への入力は、 転送速度 Rm a xまたは転送速 度 0で行われるものとする。 この場合、 8 ¥バッファ 7 0 9の 最大量を上回らないように転送するとともに、 ビデオデコーダ 9 0 0 におけるデコー ドタイミ ングに間に合うよう に転送しなけ ればならない。 ビデオデコーダ 9 0 0 におけるデコードタイミン グに間に合わないと、 V B Vバッファ 7 0 9 においてアンダーフ ローを生じることになる。
第 4図は、 エンコーダ側 V B Vバッファ 7 0 1 の占有量の遷移 例を示す図である。 縦軸は V B Vバッファの占有量、 横軸は時間 をそれぞれ表している。 縦軸の占有量は下向きに表示されており、 下方にいく程占有量が多いことを意味する。 なお、 この V B Vバ ッファ 7 0 1 の最大量は 2 2 4 K B となっている。
なお、 ここで、 Tはピクチャの発生周期、 すなわち、 フレーム レートの逆数を示す。 また、 nは任意のピクチャのピクチャ番号 を示す整数である。 また、 P Xは X番目のピクチャの実際の符号 発生量であり、 B Xは X番目のピクチャの符号化直前の V B Vバ ッファの占有量を表す。
ビデオエンコーダ 1 0 0は、 入力された動画像信号をピクチャ 番号の順に従って符号化する。 第 0番目のピクチャが符号化され た直後 (時刻 0 ) に、 V B Vバッファ 7 0 1 に発生符号量 P 0が 瞬時に転送され、 V B Vバッファの占有量が B 0 + P 0 となる。 続いて、 次の第 1番目のピクチャの符号化が終了するまでの間は、 V B Vバッファ 7 0 1 から転送速度 Rm a Xで符号の送出が行 われて、 V B Vバッファ 7 0 1 の占有量が時間とともに減少して レ <。
第 1番目のピクチャが符号化される直前 (時刻 T) になると、 V B Vバッファ 7 0 1 の占有量が B 1 となり、 そこに発生符号量 P 1 の第 1番目のピクチャが瞬時に転送される。 この結果、 時刻 Tでは、 V B Vバッファ 7 0 1 の占有量が B 1 + P 1 となる。 以下、 同様に V B Vバッファ 7 0 1からの転送と、 符号化され たピクチャの符号の V B Vバッファへ 7 0 1 の格納とが続き、 第 n番目のピクチャが符号化される直前 (時刻 n XT) となると、 V B Vノ ッファの占有量が B n (= B n— 1 + Ρ η— 1 ) となり、 そこに符号量 Ρ ηの第 η番目のピクチャが瞬時に転送される。 こ の結果、 時刻 n XTでは、 V B Vバッファ 7 0 1 の占有量が8 11 + Ρ η となる。
ここで、 符号の送出量が送入量を上回ると、 時刻 Τ χに示され るように V Β Vバッファ 7 0 1 の占有量が 0 になり、 V Β Vバッ ファ 7 0 1からのデ一夕の送出が行われなくなる。 D V Dに記録 する場合、 このようにエンコーダ側で V Β Vバッファ 7 0 1のァ ンダ一フローが発生することは許容される。 しかしながら、 D V Dに記録する場合であっても、 V B Vバッファ 7 0 1 のオーバ一 フロ一は許容されない。 従って、 この V Β Vバッファ 7 0 1がォ —バフ口一しないように、 ビデオエンコーダ 1 0 0側で制御を行 う必要がある。
第 5 Α図乃至第 5 Β図は、 デコーダ側 V B Vバッファ 7 0 9 の 占有量の遷移例を示す図である。 縦軸は V B Vバッファの占有量、 横軸は時間をそれぞれ表している。 第 4図と異なり、 縦軸の占有 量は上向きに表示されており、 上方にいく程占有量が多いことを 意味する。
この V Β Vノ ッファ 7 0 9 には、 ビッ トス トリーム中にビデオ ス ト リームが存在する様態で転送速度 R m a xで符号の格納が 行われ、 ビッ トス トリーム中にビデオス トリームが存在しないと きには格納は行われない。 また、 V B Vバッファ 7 0 9からビデ ォデコーダ 9 0 0への流出は各ピクチャのデコー ド開始夕イ ミ ングで瞬時に行われる。
第 5 A図に示されるように、 チヤプタ間をシームレスに接続し ない場合には、 先行チヤプ夕と後続チヤプ夕との間には、 デコ一 ド後の画像に切れ目を生じる。 この場合、 先行チヤプ夕の発生符 号による V B Vバッファ 7 0 9の占有量がゼロになった後で、 後 続チヤプタの発生符号が流入するため、 チヤプ夕間で V B Vバッ ファ 7 0 9 の干渉を考慮する必要がない。
しかし、 第 5 B図に示すように、 チヤプタ間をシームレスに接 続する場合には、 先行チヤプタによる V B Vバッファ 7 0 9の占 有量がゼロになる前に、 後続チヤプ夕の発生符号が流入するため、 V B Vバッファ 7 0 9 の初期値としては先行チヤプ夕による V B Vバッファ 7 0 9の占有量を引き継いで計算する必要がある。 先行チヤプタによる V B Vバッファ 7 0 9 の占有量が多く残存 している段階で後続チヤプ夕の発生符号の流入を開始してしま う と、 V B Vバッファ 7 0 9がオーバフローを生じるおそれがあ る。
一方で、 V B Vバッファ 7 0 9 に十分な量の符号が溜まってい ない段階でデコードのための流出を行おうとすると、 V B Vバッ ファ 7 0 9がアンダーフローを生じるおそれがある。 例えば、 第 5 B図で後続チヤプ夕における先頭ピクチャ ( I 2 ) をデコード するために必要な符号量を瞬時に引き抜く際、 もし V B Vバッフ ァ 7 0 9 に十分な量の符号が溜まっていない場合には、 デコード に必要なデータが得られないため、 シームレス接続はできなくな る。 事前に十分な量の符号を溜めておく には、 後続チヤプ夕のビ ッ トス トリームの転送をなるベく早く開始する必要があるが、 先 行チヤプ夕の転送が終了してから後続チヤプ夕の転送を開始し なければならないという制約があるため、 これにも限界がある。
そこで、 本発明の実施の形態では、 このような V B Vバッファ に関する条件を遵守した上でチヤプ夕間のシームレス接続を可 能にするため、 以下のように後続チヤプ夕の発生符号量を制限し ながらエンコードを行う。 なお、 ここで説明した V B Vバッファ 7 0 1および 7 0 9は表裏一体の関係にあるため、 以下の説明で は V B Vバッファ 7 0 1 を前提として説明する。
第 6図は、 本発明の実施の形態における符号化制御部 5 0 0の プロセッサ 5 1 0の機能構成例を示す図である。 この機能構成例 は、 記録モード判別部 5 1 1 と、 占有量更新部 5 1 2 と、 最適占 有量算出部 5 1 3 と、 目標符号量算出部 5 1 4 と、 目標符号量調 整部 5 1 5 と、 量子化インデックス決定部 5 1 6 とを備えている。 なお、 この例では、 R OM 5 2 0 に保持されたプログラムに従つ てプロセッサ 5 1 0が各機能を実現することを想定しているが、 これらの機能はハ一ドウエアにより実現してもよい。
記録モ一ド判別部 5 1 1 は、 チヤプタ間のシームレス接続が可 能か否かを判別する。 シームレス接続の条件としては、 シームレ ス接続をしょう とする後続チヤプ夕がその属するタイ トルの先 頭チヤプタでないこと、 先行チヤプタの最終 V〇 Bの再生時間が 1. 5秒未満でないこと、 メディア上の配置に起因するシーク時 間が許容範囲内であること、 等がある。 記録モード判別部 5 1 1 により判別されたシームレス接続の有無は、 D V Dのデータ記憶 領域における V T S I (Video Title Set Information) の P G C I (ProGram Chain Informat ion) fcおける C— P B I T (Cell PlayBack Informat ion Table) 内のシームレス · プレイバック · フラグ (seamless playback flag) に反映される。 すなわち、 シ ームレス接続を行う場合には後続チヤプタのシームレス ·プレイ バック · フラグがオンに設定され、 シームレス接続を行わない場 合には後続チヤプ夕のシームレス · プレイバック · フラグがオフ に設定される。
また、 記録モ一ド判別部 5 1 1 は、 シームレス接続可能である と判断した場合、 RAM 5 3 0 (または R OM 5 2 0 ) に保持さ れた V B Vバッファの直前の占有量を V B Vバッファの初期値 として設定する。 一方、 シームレス接続可能でないと判断した場 合には、 V B Vバッファの初期値としてゼロを設定する。 この V B Vバッファの初期値は、 第 4図における占有量 「 B 0」 に相当 する。 このようにして設定された V B Vバッファの初期値は、 占 有量更新部 5 1 2に供給される。
占有量更新部 5 1 2は、 ビデオエンコーダ 1 0 0のバッファメ モリ 1 7 1 から供給された発生符号量に基づいて V B Vバッフ ァの占有量を更新する。 例えば、 第 4図における 「B 0 + P 0」 を直前のタイミングとすると、 「B 0 + P 0」 から 「B 1」 に至 る転送符号量を減じて、 さらに発生符号量 「 P 1」 を加える。
この場合、 転送速度 Rm a xを 9. 3 M b p s と仮定し、 画面 方式として N T S C (Nat ional Televis ion Standards Committee) 方式を仮定すると、 NT S Cのフレーム周波数は
( 1 0 0 0 / 1 0 0 1 X 3 0 ) = 2 9. 9 7 H z
であることから、 1周期毎の転送符号量は、
9. 3 M b p s / 2 9. 9 7 H z = 3 1 0. 3 1 Kビッ ト となる。
この転送符号量を減じた際、 第 4図の T xにおける事象のよう に、 V Β Vバッファが空になった場合には、 それ以上の転送はで きないのでその時点での占有量はゼロとなる。 そして、 その占有 量に発生符号量を加えた値が新たな占有量となる。 このようにし て更新された占有量は R AM 5 3 0 (または R OM 5 2 0 ) に保 持されるとともに、 最適占有量算出部 5 1 3 に供給される。
最適占有量算出部 5 1 3は、 次のピクチャの符号化を行った際 の V B Vバッファの最適占有量を算出する。 この最適占有量は、 次のピクチャの符号化を行った結果として V B Vバッファの占 有量がどれ位になるのが理想的であるかを示す指標であり、 この 値より も V Β Vバッファの占有量が大きくなると、 V Β Vバッフ ァがオーバーフローする可能性が非常に高くなることを意味す る。 この最適占有量は、 次のような関数 B y = V Β V ( B X ) に より求められることが実験デ一夕により実証されている。 この関 数 V B Vを利用することにより、 早いタイミングで V B Vバッフ ァの占有量をビッ トレートに反映させることができ、 この結果、 急峻な画像劣化を抑制することができる。 ここで、 B Xは第 X番 目のピクチャを符号化する前の V B Vバッファの使用量を意味 し、 B yは第 X番目のピクチャを符号化した後の V B Vバッファ の最適占有量を意味する。
特徴 1 : B y = V B V ( B X ) は、 B xの区間 [ 0 , B m a x ] で、 B Xに対する単調増加関数である。
特徴 2 : 関数 { B y = B x } と関数 { B y = V B V (B x ) - ( R m a X T ) } とは、 B xの区間 [ 0, B m a x ] では B x = B t h (ただし、 0く B t hく B m a x ) で交わる。 特徴 3 : B x≤ B t hである場合には {V B V ( B X ) 一 ( R m a x X T) }≥ B xであり、 B x>B t hである場合には {V B V ( B X ) 一 (Rm a x XT) }〈B xである。
第 7 図に以上のような 3つの特徴を有する V B V関数の一例 を示す。 この V B V関数は、 B Xが [ 0 , B t h ] の区間では B yが所定の値( B t h以上の値)で一定となっており、 B Xが [ B t h , B m a ] の区間では B yが増加率 1未満の割合で徐々に 増加している。
第 6図において、 最適占有量算出部 5 1 3は、 このようにして 得た V B Vバッファの最適占有量を目標符号量調整部 5 1 5 に 供給する。
目標符号量算出部 5 1 4は、 シームレス接続を行おう とする後 続チヤプタの動画像信号に基づいて目標符号量を算出する。 この 目標符号量を算出するにあたっては、 種々のモデルが提案されて おり、 ここでは、 一例として公知の TM 5方式を想定する。 この TM 5方式は、 M P E G— 2の符号量制御のモデルとして提案さ れている も のであ り ( ISO/IEC JTC1/SC29/ G11, MPEG93/457, "Test Model 5, " 1993. 参照)、 ピクチャタイプに応じてそれぞ れの符号量の配分を決定するものである。
目標符号量調整部 5 1 5は、 目標符号量算出部 5 1 4により算 出された目標符号量と最適占有量算出部 5 1 3 によ り算出され た最適占有量とを参照して、 現在の占有量に目標符号量を加えた 値が最適占有量を超えていないかどうか判断する。 そして、 もし 超えているようであれば、 最適占有量から現在の占有量を引いた 値が目標符号量になるように目標符号量を調整する。 このように して調整された目標符号量は、 量子化インデックス決定部 5 1 6 に供給される。
量子化ィンデックス決定部 5 1 6は、 ビデオエンコーダ 1 0 0 における発生符号量が目標符号量調整部 5 1 5から供給された 目標符号量となるように、 量子化回路 1 5 1 における量子化特性 値に対応する量子化インデックスを決定する。 この量子化インデ ックスは信号線 1 5 9 を介して量子化回路 1 5 1 に供給される。 次に本発明の実施の形態における動画像符号化装置の動作に ついて図面を参照して説明する。
第 8 図は、 本発明の実施の形態における動画像符号化装置の処 理例を示す流れ図である。 後続のチヤプタを符号化するに先立つ て、 記録モード判別部 5 1 1 は、 記録モ一 ドとしてシームレス接 続を行うべきか否かを判別する (ステップ S 9 0 1 )。 そして、 シームレス接続を行う場合には (ステップ S 9 0 2 )、 R AM 5 3 0 (または R OM 5 2 0 ) に保持された V B Vバッファの直前 の占有量を V B Vバッファの初期値として設定する (ステップ S 9 0 3 )。 一方、 シームレス接続を行わない場合には (ステップ S 9 0 2 )、 V B Vバッファの初期値としてゼロを設定する (ス テツプ S 9 0 4 )。
記録モード判別部 5 1 1 による準備が整った後、 後続チヤプタ の動画像信号はビデオエンコーダ 1 0 0 によって 1 ピクチャ (フ レーム) ずつエンコードされる (ステップ S 9 0 5 )。 そして、 1 ピクチャ分のエンコー ドが終了する度に V B Vバッファに関 する制御が行われる (ステップ S 9 0 6 )。 後続チヤプ夕の全て のピクチャ (フレーム) のエンコードが完了するまで、 このステ ップ S 9 0 5および S 9 0 6が繰り返される (ステップ S 9 0 7 )。 第 9図は、 本発明の実施の形態における V B Vバッファに関す る制御 (ステップ S 9 0 6 ) の処理例を示す流れ図である。 第 8 図から明らかなように、 この V B Vバッファに関する制御は 1 ピ クチャ (フレーム) 分のエンコー ドが行われる度に実行される。
1 ピクチャ分のエンコードが終了すると、 まず占有量更新部 5 1 2 によ り V B Vバッ フ ァの占有量に関する情報が更新される (ステップ S 9 1 1 )。 これにより、 エンコード直後の V B Vバ ッファの占有量が把握される。 この処理内容については第 1 0図 により後述する。
そして、 最適占有量算出部 5 1 3 により、 次のエンコード後の V B Vバッファの最適占有量が算出される (ステップ S 9 1 2 )。 この最適占有量は、 例えば、 前述の V B V関数により算出するこ とができる。 また、 目標符号量算出部 5 1 4により、 次のェンコ ードにおける目標符号量が算出される (ステップ S 9 1 3 )。 こ の目標符号量は、 例えば、 公知の T M. 5方式により算出すること ができる。
そして、 目標符号量調整部 5 1 5は、 ステップ S 9 1 1 におい て把握された V B Vバッファの現在の占有量とステップ S 9 1 3 において算出された目標符号量とを加算した値がステップ S 9 1 2 において算出された最適占有量を超えているか否かを判 断し (ステップ S 9 1 4 )、 超えている場合には最適占有量から 現在の占有量を引いた値を目標符号量とすべく調整する (ステツ プ S 9 1 5 )。
このようにして調整された目標符号量に基づいて、 量子化イン デックス決定部 5 1 6は量子化インデックスを決定する (ステツ プ S 9 1 6 )。 この量子化インデックスは、 ビデオエンコーダ 1 0 0 の量子化回路 1 5 1 に供給される。
第 1 0図は、 本発明の実施の形態における V B Vバッファの占 有量に関する情報の更新 (ステップ S 9 1 1 ) の処理例を示す流 れ図である。 まず、 V B Vバッファにおける直前の占有量から一 周期分の転送符号量が減算される。 このとき、 減算前の占有量と 一周期分の転送符号量 (上述の例では、 3 1 0 . 3 1 Kビッ ト) とが比較され (ステップ S 9 2 1 )、 減算前の占有量の方が大き ければそのまま減算した結果が新たな占有量となり (ステップ S 9 2 2 )、 そうでなければ V B Vバッファはアンダーフローする ので新たな占有量はゼロとなる (ステップ S 9 2 3 )。
そして、 この新たな占有量に対してさらにビデオエンコーダ 1 0 0 における発生符号量が加算される (ステップ S 9 2 4 )。 こ の加算後の占有量が V B Vバッファの最大量を超えてしまう場 合には (ステップ S 9 2 5 )、 オーバフローするので新たな占有 量は V B Vバッファの最大量となる (ステップ S 9 2 6 )。
このように、 本発明の実施の形態によれば、 記録モード判別部 5 1 1 によ りチヤプ夕間のシームレス接続を行うか否かを判別 し、 その判別結果によって V B Vバッファの初期値を予め設定し ておいて、 シームレス接続する後続チヤプ夕の発生符号量を符号 化制御部 5 0 0 により制御することによって、 V B Vバッファに 破綻をきたさないシームレス接続を実現することができる。
なお、 本発明の実施の形態は本発明を具現化するための一例を 示したものであり、 以下に示すように請求の範囲における発明特 定事項とそれぞれ対応関係を有するが、 これに限定されるもので はなく本発明の要旨を逸脱しない範囲において種々の変形を施 すことができる。 すなわち、 本発明 ( 1 ) において、 仮想バッファは例えば V B Vバッファ 7 0 1 に対応する。 また、 記録モー ド判別手段は例え ば記録モード判別部 5 1 1 に対応する。 また、 占有量更新手段は 例えば占有量更新部 5 1 2 に対応する。 また、 最適占有量算出手 段は例えば最適占有量算出部 5 1 3 に対応する。 また、 目標符号 量算出手段は例えば目標符号量算出部 5 1 4に対応する。 また、 目標符号量調整手段は例えば目標符号量調整部 5 1 5 に対応す る。 また、 符号化手段は例えばビデオエンコーダ 1 0 0 に対応す る。
また、 本発明 ( 5 ) において、 仮想バッファは例えば V B Vバ ッファ 7 0 1 に対応する。 また、 記録モ一ド判別手段は例えば記 録モード判別部 5 1 1 に対応する。 また、 占有量更新手段は例え ば占有量更新部 5 1 2 に対応する。 また、 最適占有量算出手段は 例えば最適占有量算出部 5 1 3 に対応する。 また、 目標符号量算 出手段は例えば目標符号量算出部 5 1 4に対応する。
また、 本発明 ( 7 ) または ( 9 ) において、 仮想バッファは例 えば V B Vバッファ 7 0 1 に対応する。 また、 動画像信号に含ま れる先行チヤプタと後続チヤプ夕との間でシームレス接続が可 能か否を判別する手順は例えばステップ S 9 0 1 に対応する。 ま た、 判別結果に応じて前記仮想バッファの占有量の初期値を設定 する手順は例えばステップ S 9 0 2乃至 S 9 0 4に対応する。 ま た、 符号化が行われるたびに前記仮想バッファの占有量を更新す る手順は例えばステップ S 9 1 1 に対応する。 また、 更新された 仮想バッ フ ァの占有量に基づいて所定の最適占有量を算出する 手順は例えばステップ S 9 1 2 に対応する。 また、 後続チヤプタ の動画像信号に基づいて所定の目標符号量を算出する手順は例 えばステップ S 9 1 3 に対応する。 また、 仮想バッファの占有量 に目標符号量を加えた総量が最適占有量を超えないよう に目標 符号量を調整して符号化に供する手順は例えばステップ S 9 1 4および S 9 1 5 に対応する。
また、 本発明 ( 8 ) または ( 1 0 ) において、 仮想バッファは 例えば V B Vバッファ 7 0 1 に対応する。 また、 動画像信号に含 まれる先行チヤプ夕と後続チヤプタとの間でシームレス接続が 可能か否を判別する手順は例えばステップ S 9 0 1 に対応する。 また、 上記判別結果においてシームレス接続が可能と判別された 場合には後続チヤプ夕の動画像信号が仮想バッファに転送され る直前の仮想バッファの占有量を仮想バッファの占有量の初期 値とし、 シームレス接続が不可能と判別された場合にはゼロを仮 想バッ フ ァの占有量の初期値とする手順は例えばステップ S 9 0 2乃至 S 9 0 4に対応する。 また、 符号化が行われるたびに前 記仮想バッ フ ァの占有量を更新する手順は例えばステップ S 9 1 1 に対応する。 また、 更新された仮想バッファの占有量に基づ いて所定の最適占有量を算出する手順は例えばステップ S 9 1 2 に対応する。 また、 後続チヤプ夕の動画像信号に基づいて所定 の目標符号量を算出する手順は例えばステップ S 9 1 3 に対応 する。 また、 仮想バッファの占有量に目標符号量を加えた総量が 最適占有量を超えないように目標符号量を調整して符号化に供 する手順は例えばステップ S 9 1 4および S 9 1 5 に対応する。
なお、 本発明の実施の形態において説明した処理手順は、 これ ら一連の手順を有する方法として捉えてもよく、 また、 これら一 連の手順をコ ンピュー夕に実行させるためのプログラム乃至そ のプログラムを記憶する記録媒体として捉えてもよい。 産業上の利用可能性
本発明の活用例として、 例えば動画像信号を M P E G— 2形式 に符号化して D V Dに書込みを行う際に本発明を適用すること ができる。

Claims

請求の範囲
1 . 動画像信号を符号化し、 その発生符号量と出力先への転送 符号量とにより規定される仮想バッファの占有量に応じて前記 符号化を制御する動画像符号化装置であって、
前記動画像信号に含まれる先行チヤプ夕と後続チヤプ夕との 間でシームレス接続が可能か否を判別し、 当該判別結果に応じて 前記仮想バッファの占有量の初期値を設定する記録モード判別 手段と、
前記符号化が行われるたびに前記仮想バッファの占有量を更 新する占有量更新手段と、
前記更新された仮想バッファの占有量に基づいて所定の最適 占有量を算出する最適占有量算出手段と、
前記後続チヤプタの動画像信号に基づいて所定の目標符号量 を算出する目標符号量算出手段と、
前記仮想バッ フ ァの占有量に前記目標符号量を加えた総量が 前記最適占有量を超えないように前記目標符号量を調整する目 標符号量調整手段と、
前記調整された目標符号量に従って前記符号化を行う符号化 手段とを具備することを特徴とする動画像符号化装置。
2 . 前記記録モード判別手段は、 前記シ一ムレス接続が可能で あれば前記後続チヤプタの動画像信号が前記仮想バッ ファに転 送される直前の前記仮想バッフ ァの占有量を前記仮想バッファ の占有量の初期値とし、 前記シームレス接続が不可能であればゼ 口を前記仮想バッファの占有量の初期値とすることを特徴とす る請求の範囲第 1項記載の動画像符号化装置。
3 . 前記占有量更新手段は、 前記占有量が前記転送符号量より 多い場合には前記占有量から前記転送符号量を減じて前記発生 符号量を加えた値であって前記仮想バッファの最大値を超えな い値を新たな占有量とし、 前記占有量が前記転送符号量以下の場 合には前記発生符号量を新たな占有量とすることを特徴とする 請求の範囲第 2項記載の動画像符号化装置。
4 . 前記最適占有量算出手段は、 前記更新された仮想バッファ の占有量が大きいほど大きいもしく は等しい値を前記最適占有 量として算出することを特徴とする請求の範囲第 2項記載の動 画像符号化装置。
5 . 動画像信号の符号化における発生符号量と出力先への転送 符号量とにより規定される仮想バッファの占有量に応じて前記 符号化を制御する動画像符号化制御装置であって、
前記動画像信号に含まれる先行チヤプタと後続チヤプ夕との 間でシームレス接続が可能か否を判別し、 当該判別結果に応じて 前記仮想バッファの占有量の初期値を設定する記録モー ド判別 手段と、
前記符号化が行われるたびに前記仮想バッファの占有量を更 新する占有量更新手段と、
前記更新された仮想バッファの占有量に基づいて所定の最適 占有量を算出する最適占有量算出手段と、
前記後続チヤプ夕の動画像信号に基づいて所定の目標符号量 を算出する目標符号量算出手段と、
前記仮想バッ フ ァの占有量に前記目標符号量を加えた総量が 前記最適占有量を超えないように前記目標符号量を調整して前 記符号化に供する目標符号量調整手段とを具備することを特徴 とする動画像符号化制御装置。
6 . 前記記録モード判別手段は、 前記シームレス接続が可能で あれば前記後続チヤプ夕の動画像信号が前記仮想バッフ ァ に転 送される直前の前記仮想バッファの占有量を前記仮想バッファ の占有量の初期値とし、 前記シームレス接続が不可能であればゼ 口を前記仮想バッファの占有量の初期値とすることを特徴とす る請求の範囲第 5項記載の動画像符号化制御装置。
7 . 動画像信号の符号化における発生符号量と出力先への転送 符号量とによ り規定される仮想バッ フ ァの占有量に応じて前記 符号化を制御する動画像符号化制御方法であって、
前記動画像信号に含まれる先行チヤプ夕と後続チヤプ夕との 間でシームレス接続が可能か否を判別する手順と、
前記判別結果に応じて前記仮想バッファの占有量の初期値を 設定する手順と、
前記符号化が行われるたびに前記仮想バッフ ァの占有量を更 新する手順と、
前記更新された仮想バッ ファの占有量に基づいて所定の最適 占有量を算出する手順と、
前記後続チヤプ夕の動画像信号に基づいて所定の目標符号量 を算出する手順と、
前記仮想バッフ ァの占有量に前記目標符号量を加えた総量が 前記最適占有量を超えないように前記目標符号量を調整して前 記符号化に供する手順とを具備することを特徴とする動画像符 号化制御方法。
8 . 動画像信号の符号化における発生符号量と出力先への転送 符号量とによ り規定される仮想バッ フ ァの占有量に応じて前記 符号化を制御する動画像符号化制御方法であって、 前記動画像信号に含まれる先行チヤプ夕と後続チヤプ夕との 間でシームレス接続が可能か否を判別する手順と、
前記判別結果において前記シームレス接続が可能と判別され た場合には前記後続チヤプタの動画像信号が前記仮想バッファ に転送される直前の前記仮想バッ フ ァの占有量を前記仮想バッ ファの占有量の初期値とし、 前記シームレス接続が不可能と判別 された場合にはゼロを前記仮想バッ フ ァの占有量の初期値とす る手順と、
前記符号化が行われるたびに前記仮想バッフ ァの占有量を更 新する手順と、
前記更新された仮想バッ フ ァの占有量に基づいて所定の最適 占有量を算出する手順と、
前記後続チヤプ夕の動画像信号に基づいて所定の目標符号量 を算出する手順と、
前記仮想バッフ ァの占有量に前記目標符号量を加えた総量が 前記最適占有量を超えないように前記目標符号量を調整して前 記符号化に供する手順とを具備することを特徴とする動画像符 号化制御方法。
9 . 動画像信号の符号化における発生符号量と出力先への転送 符号量とにより規定される仮想バッファの占有量に応じて前記 符号化を制御するプログラムであって、
前記動画像信号に含まれる先行チヤプ夕と後続チヤプ夕との 間でシームレス接続が可能か否を判別する手順と、
前記判別結果に応じて前記仮想バッファの占有量の初期値を 設定する手順と、 前記符号化が行われるたびに前記仮想バッフ ァの占有量を更 新する手順と、
前記更新された仮想バッフ ァの占有量に基づいて所定の最適 占有量を算出する手順と、
前記後続チヤプ夕の動画像信号に基づいて所定の目標符号量 を算出する手順と、
前記仮想バッファの占有量に前記目標符号量を加えた総量が 前記最適占有量を超えないよう に前記目標符号量を調整して前 記符号化に供する手順とをコンピュータに実行させる ことを特 徵とするプログラム。
1 0 . 動画像信号の符号化における発生符号量と出力先への転 送符号量とにより規定される仮想バッファの占有量に応じて前 記符号化を制御するプログラムであって、
前記動画像信号に含まれる先行チヤプ夕と後続チヤプ夕との 間でシームレス接続が可能か否を判別する手順と、
前記判別結果において前記シームレス接続が可能と判別され た場合には前記後続チヤプタの動画像信号が前記仮想バッ ファ に転送される直前の前記仮想バッ フ ァの占有量を前記仮想バッ ファの占有量の初期値とし、 前記シ一ムレス接続が不可能と判別 された場合にはゼロを前記仮想バッファの占有量の初期値とす る手順と、
前記符号化が行われるたびに前記仮想バッ フ ァの占有量を更 新する手順と、
前記更新された仮想バッフ ァの占有量に基づいて所定の最適 占有量を算出する手順と、
前記後続チヤプ夕の動画像信号に基づいて所定の目標符号量 を算出する手順と、
前記仮想バッ フ ァの占有量に前記目標符号量を加えた総量が 前記最適占有量を超えないよう に前記目標符号量を調整して前 記符号化に供する手順とをコンピュータに実行させることを特 徴とするプログラム。
PCT/JP2004/016472 2003-10-29 2004-10-29 動画像符号化装置および動画像符号化制御方法 WO2005041582A1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
US10/538,086 US7835436B2 (en) 2003-10-29 2004-10-29 Video-encoding device and video-encoding control method
CN2004800017539A CN1723709B (zh) 2003-10-29 2004-10-29 视频编码设备和视频编码控制设备及其方法
KR20057011846A KR101091418B1 (ko) 2003-10-29 2004-10-29 동화상 부호화 장치 및 동화상 부호화 제어 방법
EP04793392A EP1583365A4 (en) 2003-10-29 2004-10-29 VIDEO CODIER AND VIDEO PROCESS CONTROL

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2003-369388 2003-10-29
JP2003369388A JP3675464B2 (ja) 2003-10-29 2003-10-29 動画像符号化装置および動画像符号化制御方法

Publications (1)

Publication Number Publication Date
WO2005041582A1 true WO2005041582A1 (ja) 2005-05-06

Family

ID=34510387

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2004/016472 WO2005041582A1 (ja) 2003-10-29 2004-10-29 動画像符号化装置および動画像符号化制御方法

Country Status (7)

Country Link
US (1) US7835436B2 (ja)
EP (1) EP1583365A4 (ja)
JP (1) JP3675464B2 (ja)
KR (1) KR101091418B1 (ja)
CN (1) CN1723709B (ja)
TW (1) TWI264227B (ja)
WO (1) WO2005041582A1 (ja)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4857895B2 (ja) 2006-05-10 2012-01-18 ソニー株式会社 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
JP4779797B2 (ja) * 2006-05-10 2011-09-28 ソニー株式会社 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
CN101193321B (zh) * 2006-11-27 2012-02-22 汤姆森许可贸易公司 编码设备、解码设备、记录设备、音频/视频数据传送系统
JP4900945B2 (ja) 2007-01-18 2012-03-21 キヤノン株式会社 記録装置、及び記録方法
JP5052220B2 (ja) 2007-06-19 2012-10-17 パナソニック株式会社 動画像符号化装置
JP5046907B2 (ja) * 2007-12-17 2012-10-10 キヤノン株式会社 記録装置、その制御方法、プログラム
JP2010103969A (ja) * 2008-09-25 2010-05-06 Renesas Technology Corp 画像復号方法、画像復号装置、画像符号化方法及び画像符号化装置
JP5152402B2 (ja) * 2009-02-27 2013-02-27 富士通株式会社 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
JP2011151784A (ja) 2009-12-25 2011-08-04 Panasonic Corp 動画像多重化装置、映像音声記録装置及び動画像多重化方法
JP5685075B2 (ja) * 2010-12-24 2015-03-18 キヤノン株式会社 記録装置、記録方法およびプログラム
EP3136727B1 (en) 2011-04-12 2018-06-13 Sun Patent Trust Motion-video coding method and motion-video coding apparatus
JP2012244542A (ja) * 2011-05-23 2012-12-10 Sony Corp 符号化装置、符号化方法、及びプログラム
EP3337172B1 (en) 2011-05-24 2020-09-09 Velos Media International Limited Image encoding method, image encoding apparatus
US9485518B2 (en) 2011-05-27 2016-11-01 Sun Patent Trust Decoding method and apparatus with candidate motion vectors
TR201819396T4 (tr) 2011-05-27 2019-01-21 Sun Patent Trust Görüntü Kod Çözme Metodu Ve Görüntü Kod Çözme Cihazı
SG194746A1 (en) 2011-05-31 2013-12-30 Kaba Gmbh Image encoding method, image encoding device, image decoding method, image decoding device, and image encoding/decoding device
MX2013012209A (es) 2011-05-31 2013-11-01 Panasonic Corp Metodo de codificacion de video, aparato de codificacion de video, metodo de decodificacion de video, aparato de decodificacion de video y aparato de codificacion/decodificacion de video.
JP5937594B2 (ja) 2011-06-30 2016-06-22 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 画像復号方法及び画像復号装置
AU2012291454B2 (en) 2011-08-03 2016-11-17 Sun Patent Trust Video encoding method, video encoding apparatus, video decoding method, video decoding apparatus, and video encoding/decoding apparatus
WO2013057877A1 (ja) 2011-10-19 2013-04-25 パナソニック株式会社 画像符号化方法、画像符号化装置、画像復号方法、および、画像復号装置
JP6182719B2 (ja) * 2012-06-29 2017-08-23 ヴェロス メディア インターナショナル リミテッドVelos Media International Limited 符号化装置および符号化方法
JP2017168878A (ja) * 2016-03-14 2017-09-21 ルネサスエレクトロニクス株式会社 半導体装置、符号化制御方法及びカメラ装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997013361A1 (fr) * 1995-09-29 1997-04-10 Matsushita Electric Industrial Co., Ltd. Procede et dispositif de codage destine a donner des informations d'acheminement de recherche-reproduction a un train binaire
JPH09509551A (ja) * 1994-12-02 1997-09-22 フィリップス エレクトロニクス ネムローゼ フェンノートシャップ ビデオ編集用バッファの管理
JPH114445A (ja) * 1997-06-11 1999-01-06 Sony Corp 画像符号化装置および方法
JPH11112947A (ja) * 1997-10-03 1999-04-23 Sony Corp データ多重化装置およびデータ多重化方法、データ処理装置およびデータ処理方法、並びに伝送媒体
JPH11155131A (ja) * 1997-09-17 1999-06-08 Matsushita Electric Ind Co Ltd ビデオデータ編集装置、ビデオデータ編集装置が編集媒体として用いる光ディスク、編集プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2001160945A (ja) * 1999-09-20 2001-06-12 Matsushita Electric Ind Co Ltd シームレス再生に適した光ディスク記録装置、再生装置及び記録方法
WO2001080570A2 (en) 2000-04-19 2001-10-25 General Instrument Corporation Rate control and buffer protection for variable bit rate video programs over a constant rate channel
EP1217842A2 (en) 2000-12-21 2002-06-26 General Instrument Corporation Frame bit-size allocation for seamlessly spliced, variable-rate compressed digital video signals

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9424437D0 (en) * 1994-12-02 1995-01-18 Philips Electronics Uk Ltd Encoder system level buffer management
TW303570B (ja) * 1995-09-29 1997-04-21 Matsushita Electric Ind Co Ltd
US6381398B1 (en) * 1996-11-13 2002-04-30 Matsushita Electric Industrial Co., Ltd. Apparatus and method of generating bit stream for information recording disc storage which enables seamless reproduction of a plurality of pieces of image information, and recording medium on which program applied to the generating apparatus is recorded
KR100555164B1 (ko) * 1997-07-25 2006-03-03 소니 가부시끼 가이샤 편집 장치, 편집 방법, 재부호화 장치, 재부호화 방법, 스플라이싱 장치 및 스플라이싱 방법
EP0903742B1 (en) * 1997-09-17 2003-03-19 Matsushita Electric Industrial Co., Ltd Video data editing apparatus, optical disc for use as a recording medium of a video data editing apparatus, and computer-readable recording medium
JP3837889B2 (ja) * 1997-12-29 2006-10-25 ソニー株式会社 エンコード方法およびエンコード装置
JP3997367B2 (ja) * 1998-04-30 2007-10-24 ソニー株式会社 記録再生装置および方法、並びに記録媒体
US6567554B1 (en) * 1999-03-12 2003-05-20 Victor Company Of Japan, Limited Data coding method and apparatus therefor
US6782193B1 (en) 1999-09-20 2004-08-24 Matsushita Electric Industrial Co., Ltd. Optical disc recording apparatus, optical disc reproduction apparatus, and optical disc recording method that are all suitable for seamless reproduction
JP3889552B2 (ja) * 2000-06-09 2007-03-07 パイオニア株式会社 符号量割り当て装置および方法
US7292782B2 (en) * 2000-09-27 2007-11-06 Victor Company Of Japan, Limited MPEG picture data recording apparatus, MPEG picture data recording method, MPEG picture data recording medium, MPEG picture data generating apparatus, MPEG picture data reproducing apparatus, and MPEG picture data reproducing method
EP1372113B1 (en) * 2002-06-11 2005-10-19 STMicroelectronics S.r.l. Variable bit rate video encoding method and device

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09509551A (ja) * 1994-12-02 1997-09-22 フィリップス エレクトロニクス ネムローゼ フェンノートシャップ ビデオ編集用バッファの管理
WO1997013361A1 (fr) * 1995-09-29 1997-04-10 Matsushita Electric Industrial Co., Ltd. Procede et dispositif de codage destine a donner des informations d'acheminement de recherche-reproduction a un train binaire
JPH114445A (ja) * 1997-06-11 1999-01-06 Sony Corp 画像符号化装置および方法
JPH11155131A (ja) * 1997-09-17 1999-06-08 Matsushita Electric Ind Co Ltd ビデオデータ編集装置、ビデオデータ編集装置が編集媒体として用いる光ディスク、編集プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH11112947A (ja) * 1997-10-03 1999-04-23 Sony Corp データ多重化装置およびデータ多重化方法、データ処理装置およびデータ処理方法、並びに伝送媒体
JP2001160945A (ja) * 1999-09-20 2001-06-12 Matsushita Electric Ind Co Ltd シームレス再生に適した光ディスク記録装置、再生装置及び記録方法
WO2001080570A2 (en) 2000-04-19 2001-10-25 General Instrument Corporation Rate control and buffer protection for variable bit rate video programs over a constant rate channel
EP1217842A2 (en) 2000-12-21 2002-06-26 General Instrument Corporation Frame bit-size allocation for seamlessly spliced, variable-rate compressed digital video signals

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP1583365A4

Also Published As

Publication number Publication date
US20060050778A1 (en) 2006-03-09
US7835436B2 (en) 2010-11-16
JP2005136633A (ja) 2005-05-26
EP1583365A1 (en) 2005-10-05
CN1723709B (zh) 2012-04-25
JP3675464B2 (ja) 2005-07-27
TW200531553A (en) 2005-09-16
KR20060121656A (ko) 2006-11-29
CN1723709A (zh) 2006-01-18
TWI264227B (en) 2006-10-11
KR101091418B1 (ko) 2011-12-07
EP1583365A4 (en) 2011-11-30

Similar Documents

Publication Publication Date Title
WO2005041582A1 (ja) 動画像符号化装置および動画像符号化制御方法
JP3736808B2 (ja) 編集装置、編集方法、再符号化装置及び再符号化方法
JP4769717B2 (ja) 画像復号化方法
JP4570532B2 (ja) 動き検出装置、動き検出方法、集積回路およびプログラム
US8817873B2 (en) Image coding/recording apparatus and image coding/recording method
US20040202249A1 (en) Real-time MPEG video encoding method of maintaining synchronization between video and audio
US20060239563A1 (en) Method and device for compressed domain video editing
KR20030012761A (ko) 데이터 다중화 방법, 데이터 기록 매체, 데이터 기록 장치및 데이터 기록 프로그램
JPH09509035A (ja) オーディオ/ビデオタイミング不一致管理
JP2001189940A (ja) 映像データフォーマット装置及び映像データストレージ装置
US20080019444A1 (en) Information Processing Apparatus and Information Processing Method, Recording Medium, and Program
JPH1188874A (ja) 符号化装置における編集可能点挿入方法および符号化装置
JP4902935B2 (ja) 情報処理装置、情報処理方法、プログラム、及び記録媒体
JPH08214296A (ja) デコーダおよびmpegシステムデコーダ
JPH08251582A (ja) 符号化データ編集装置
JP5046907B2 (ja) 記録装置、その制御方法、プログラム
JP3307367B2 (ja) 可変転送レート符号化装置
JP4867872B2 (ja) 画像処理装置、この画像処理装置の制御方法、及び、プログラム
JP2001189933A (ja) 復号化バッファ制御装置
JP2008211555A (ja) 映像信号符号化装置および映像信号符号化方法
JP2008211556A (ja) 映像信号符号化装置および映像信号符号化方法
JPH11187395A (ja) 可変転送レート圧縮情報復号装置
JP2003092733A (ja) Mpegデータ記録装置
JP2006311135A (ja) 動画像符号化装置
JP2003116106A (ja) Mpegデータ記録方法

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BW BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE EG ES FI GB GD GE GH GM HR HU ID IL IN IS KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NA NI NO NZ OM PG PH PL PT RO RU SC SD SE SG SK SL SY TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): BW GH GM KE LS MW MZ NA SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IT LU MC NL PL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

ENP Entry into the national phase

Ref document number: 2006050778

Country of ref document: US

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 10538086

Country of ref document: US

WWE Wipo information: entry into national phase

Ref document number: 2004793392

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 1020057011846

Country of ref document: KR

121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 20048017539

Country of ref document: CN

WWP Wipo information: published in national office

Ref document number: 2004793392

Country of ref document: EP

WWP Wipo information: published in national office

Ref document number: 1020057011846

Country of ref document: KR