WO1999031886A1 - Image encoding method and device - Google Patents

Image encoding method and device Download PDF

Info

Publication number
WO1999031886A1
WO1999031886A1 PCT/JP1998/005626 JP9805626W WO9931886A1 WO 1999031886 A1 WO1999031886 A1 WO 1999031886A1 JP 9805626 W JP9805626 W JP 9805626W WO 9931886 A1 WO9931886 A1 WO 9931886A1
Authority
WO
WIPO (PCT)
Prior art keywords
pull
encoding
pattern
down pattern
stability
Prior art date
Application number
PCT/JP1998/005626
Other languages
French (fr)
Japanese (ja)
Inventor
Masaaki Isozaki
Atsuo Yada
Original Assignee
Sony Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corporation filed Critical Sony Corporation
Publication of WO1999031886A1 publication Critical patent/WO1999031886A1/en
Priority to US09/374,134 priority Critical patent/US6275528B1/en

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/87Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving scene cut or scene change detection in combination with video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/142Detection of scene cut or scene change
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/179Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scene or a shot
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive

Definitions

  • TECHNICAL FIELD The present invention relates to an image encoding method and apparatus for encoding video material, and more particularly to a video encoding method and apparatus based on a pull-down pattern of an input video material that has been subjected to pull-down conversion.
  • TECHNICAL FIELD The present invention relates to an image encoding method and apparatus for performing encoding.
  • an encoding system that performs compression coding on the video information first requires The encoding difficulty (diff iculty) of the image of the video material is measured, and then, based on the encoding difficulty, each is set so as to be within a given number of bytes within the storage capacity of the package media.
  • An encoding method that performs bit allocation processing for each frame of video information is generally adopted.
  • this encoding method is referred to as a two-pass encoding method.
  • FIG. 1 shows an example of the configuration of a conventional video encoding system used for authoring a DVD or the like by compressing and encoding video information.
  • the supervisor 103 manages the entire video encoding system, gives encoding conditions to each encoding system such as video, audio, and menu, and receives a report of the encoding result.
  • the video encoding conditions are specified by the file “v.enc”, and the video encoder outputs the address “v” on the RAID (Redundant Arrays of Inexpensive Disks) 104 where the encoded bitstream is written. .adr ”and“ vxxx.aui ”required for multiplexing bitstreams are reported.
  • the main controller 11 1 controls the operation of the entire video encoder system by data communication with a supervisor 103 connected via a network 102.
  • the main controller 111 receives control from the supervisor 103 and manages it through the management of a graphical user interface (GUI) section 114.
  • GUI graphical user interface
  • One night operation is accepted, and the bit assignment unit 115, encoder control unit 116, and VTR control unit 117 managed by the GUI unit 114 provide the encoder 112, video Controls the operation of the precoder (VTR) 110.
  • the main controller 111 encodes the material to be processed in accordance with the encoding condition notified from the supervisor 103 and notifies the supervisor 3 of the processing result. Further, the main controller 111 can receive the setting of the operator via the GUI unit 114, and can change the above detailed conditions of the encoding.
  • the bit assigning unit 115 determines the encoding processing conditions in frame units according to the encoding condition file “v.enc” notified from the supervisor 103, and the control data based on these conditions is filed. In this case, the control unit 116 is notified by the CTL filej. At this time, the bit assignment unit 115 sets the bit allocation (bit assignment) in the encoding process, and further sets the set conditions. In addition, the bit assignment section 115 writes the video data D2 when the video data D2 that has been compressed is recorded in the RA ID 104. Notify the supervisor 103 of the address data “v.adr” on the RA ID 104 together with the information “vxxx.aui” such as the amount of data required for the multiplexing process in the subsequent stage.
  • the encoder control unit 116 controls the operation of the encoder 112 in accordance with the control file “CTL filej notified from the bit assignment unit 115. Further, the encoder control unit 116 controls the encoding The data of the encoding difficulty "difficulty" required for the processing is notified to the bit assigning unit 115 in frame units, and when the video data D2 is recorded in the RAID 104, the data of the recording address is deleted. In the evening, “v.adr” is notified to the bit assigning unit 115 of “vxxx.auij”, which is necessary for the subsequent multiplexing processing.
  • VTR control section 1 17 is notified from the supervisor 3
  • the operation of the video tape recorder (VTR) 110 is controlled in accordance with the editing list to be played, and the desired material to be edited is reproduced.
  • the video tape recorder (VTR) 110 is the main controller.
  • the video data D 1 recorded on the magnetic tape is reproduced and output to the encoder 112.
  • Encoders 1 and 2 are connected to the main controller from supervisor 103
  • the video data D 1 output from 10 is compression-coded by the method of M PEG (Moving Picture Experts Group).
  • the encoder 1 12 notifies the main controller 1 1 1 of the result of the encoding process, and the main controller 1 1 1 1 controls the encoding condition in the data compression and generates the Control the amount of bits to be applied.
  • the main controller 111 can grasp the amount of bits generated by data compression in frame units.
  • the encoder 112 simply compresses the video data D 1 during the processing of the pre-encoding condition setting in the two-pass encoding (during provisional encoding), and sends the processing result to the main controller 111.
  • the compressed video data D2 is recorded in RAID 104, and the address where the data was recorded is also recorded.
  • the main controller 11 is notified of the amount of data and the amount of data.
  • the monitor device 113 is configured to monitor the video data D2 that has been compressed by the encoder 112. With this monitor device 113, this video encoding system allows the operator Can check the result of the data compression processing as necessary, that is, perform a so-called preview. Then, the operator can operate the main controller 111 based on the preview result to change the encoding conditions in detail.
  • the DVD employs the Moving Picture Experts Group (MPEG) as a compression method for video decoding.
  • MPEG Moving Picture Experts Group
  • MPEG is a method of compressing data by removing the redundancy in the time direction by motion compensation prediction. It predicts the current from I (Intra) pictures coded only within the frame and past screens. Three types of coded images are used: P (Predictive) pictures to be coded, and B (Bidirectionally Predictive) pictures, which are coded by predicting the current from past and future images.
  • these images are defined as a GOP (Group of Pictures), which always includes one I-picture.
  • FIG. 2 shows an example of the G0P structure.
  • the number N of pictures (frames) constituting one GOP is 15.
  • the order in which the pictures of the GOP are displayed is different from the order in which they are coded, and the first picture of the GOP in the display order is before the I picture and after the P picture or I picture. It is a B victim.
  • the last of G ⁇ P in the display order is the first P picture before the next I picture.
  • FIG. 3 shows a basic processing procedure of the two-pass code in the video code system described above.
  • the encoding conditions "v.enc” such as the total amount of bits allocated to video information and the maximum rate are given from the supervisor 103 via the network 102.
  • the encoder control section 116 is set according to this encoder condition.
  • the encoder control unit 116 measures the encoding difficulty (diff iculty) of the encoding material using the encoder 112.
  • the DC value of each pixel of the material and the motion vector amount ME are also measured.
  • a file is created based on these measurement results.
  • the actual measurement of the coding difficulty is performed as follows.
  • Video information to be used as an encoding material is reproduced by a VTR 110 from a digital video cassette, which is a master tape.
  • the encoder control unit 116 measures the encoding difficulty of the video information D1 reproduced by the VTR 110 via the encoder 112.
  • the number of generated bits is measured by setting the number of quantization steps to a fixed value during encoding.
  • the amount of generated bits increases in images with many motions and many high frequency components, and decreases in still images and images with many flat parts.
  • the amount of generated bits is defined as the encoding difficulty.
  • step S53 the encoder control unit 1 according to the magnitude of the encoding difficulty of each picture measured in step S52 according to the encoding condition set in step S51. 16 executes the bit allocation calculation program "BIT-ASSIGNj" in the bit assignment section 115 to calculate the allocation of the allocated bit amount (evening amount). Then, in step S54, provisional encoding is performed using the result of the above-described bit allocation calculation, and this encoding is executed according to the image quality of the output decoder output from the built-in encoder 112. Or not at the time of the operation.
  • bit stream is not output to the RAID 104 with the bit allocation described above, but the image quality is checked in the Preview mode, which is a mode in which the operator can specify an arbitrary processing range. Is done. Then, in step S55, the image quality is evaluated. If there is a problem with the image quality (NG), the process proceeds to step S56, where the bit rate of the problematic part is increased or the filter level is adjusted. After performing customization work for image quality adjustment, recalculation of bit allocation is performed in step S57.
  • step S54 where the customized portion is previewed, and the image quality is confirmed in step S55.
  • step S58 the encoder 1 12 executes encoding for the entire material by the bit allocation recalculated in step S57. .
  • step S55 if it is determined in step S55 that there is no problem with the image quality, the process directly proceeds to step S58, where the encoder 112 determines the encoder based on the bit allocation calculated in step S53. Is executed.
  • step S59 post-processing such as writing the bit stream as a result of encoding to RAID 104 via SCSI (Small Computer System Interface) or the like is performed. -The processing ends.
  • the video encoder control unit 116 reports the information of the encoding result as described above to the supervisor 103 via the network 102.
  • step S52 the processing of each step except for step S52, step S54, and step S58 is performed offline.
  • FIGS. 4A to 4G show examples of processing of surplus bits in the bit allocation calculation.
  • the supervisor specifies the total bit amount “QTY_BYTES” (Fig. 4A) and the maximum bit rate “MAXMTE” allocated to video information in the recording capacity of package media such as digital video discs (DVDs). Is done.
  • the encoder control section 116 executes the bit allocation calculation program "BIT_ASSIGN" in the bit assignment section 115, and first, the bit rate becomes less than the maximum bit rate "MAXRATE".
  • the total number of bits “USB_BYTES”, which is limited as described above, is calculated (Fig. 4B), and the value obtained by subtracting the number of bits “T0TA HEADERj” required for the GOP header (Header) from this value is calculated. From the total number of frames, calculate “SUPPLY—BYTES”, which is the target value of the total number of evening targets (Fig. 4C).
  • bit amount (evening gate amount) allocated to each picture is allocated so as to be within the size of this “SUPPLY_BYTES”. Assuming that the total amount of bits allocated to all pictures is “TARGET_BYTES”, the target value “SUPPLY — BYTES ”minus the above“ TARGET—BYTES ”is the amount“ REMAIN_BYTES ”that indicates the remainder (Remain) in bit allocation.
  • FIG. 5 shows a specific example of the procedure of the bit allocation calculation process in step S53 of FIG.
  • step S61 the total bit amount “QTY_BYTES” and the maximum bit rate “MAXRATE” sent from the supervisor 3 are input.
  • step S62 the file of the measurement result of the encoding difficulty (diffi cu lty) created in step S52 of FIG. 3 is read as it is.
  • step S63 the point at which the scene changes is detected from the DC value of each image measured together with the encoding difficulty and the amount of change in the parameter of the motion vector ME over time. Is done.
  • step S63 The detection / processing of the scene change in step S63 is based on the “video” disclosed in the specification and drawings of Japanese Patent Application No. 8-274904, which was already filed by the present applicant. Processing for detecting a scene change point in the “signal processing device” can be applied.
  • This "video signal processing device” detects the DC level of each frame of the video signal, and detects a scene change frame of the video signal from an error value obtained by approximating the DC level with a curve. This is to clarify the change points.
  • the P picture is changed to an I picture to improve the picture quality.
  • step S64 a chapter (CHAPTER) boundary process is performed.
  • step S65 interpolation / correction is performed on the value of the coding difficulty (D ifficulty) corresponding to the picture type such as I picture, P picture, and B picture, which has been changed as a result of the above series of operations. Is performed.
  • step S66 according to the encoding difficulty obtained by the interpolation / correction processing in step S65 and the number of bits “SUPPLY—BYTES” given to the entire material to be encoded, The number of target bits for each picture is calculated.
  • step S67 after calculating the address (ADDRESS) of RAID 4 when writing the bit stream of the encoding result, the process proceeds to step S68, and the control file for the encoder is obtained. Created and the process ends.
  • the difficulty of encoding the material (Diff iculty)
  • the number of evening target bits for each picture is calculated according to the number of bits “SUPPLY—BYTES” given to the entire material and a control file for the encoder is created.
  • bit allocation amount is first allocated in GOP units, and then the bit allocation is performed within each GOP according to the encoding difficulty (Difficulty) of each picture.
  • the bit allocation amount “gop-targetj” in G0P units at the time of encoding is allocated.
  • Figure 6 shows the simplest function for converting the sum of the encoding difficulty for each GOP “gop—diffj” and the bit allocation “gop_target” in G ⁇ P units at the time of encoding. An example is shown.
  • USB—BYTES min (QTY—BYTES-MAXRATE x KT
  • Tota frame_number is the total number of frames of the material to be encoded
  • min (s, t) is a function that selects the smaller of s or t. It is.
  • DIFFICULTY-SUM is the sum of the encoding difficulty of all pictures.
  • ⁇ y SUPPLY_BYTES
  • ⁇ x DIFFICULTY-one SUM
  • n is the total number of GOPs. Therefore
  • each GOP bits are allocated according to the coding difficulty of each picture.
  • the evening target amount of each picture is obtained by the following equation.
  • target (k) GOP— TARGET x diffuculty (k) / G0P_diff
  • Figure 7 illustrates the principle of this 2-3 pulldown conversion.
  • the phase of the pull-down pattern is determined when converting film material to NTSC video material. In many cases, patterns are converted regularly.
  • One frame of video material is composed of two fields, of which the first field (1st field) is the top field (top_field) and the second field (2nd field) is the bottom field. (Bottom—field).
  • the first field (1st field) is the top field (top_field) and the second field (2nd field) is the bottom field. (Bottom—field).
  • a place where the same field image is repeated is called a repeat-first-field.
  • FIG. 2 is a state transition diagram of p_mode [k] in the pull-down. If the pulldowns are regular and continuous, the value of p—mode [k] will increase by one in the remainder modulo 5 (mod 5) with increasing frame number k.
  • P_mode [k + l] (p_mode [k] + 1) mod 5 ⁇ ⁇ ⁇ (7) If the pull-down pattern is disturbed, the value can be repeated only when p_mode is 0 or 2.
  • the automatic detection method of the pull-down pattern described above is based on the difference between the top field and the bottom field between the current frame and the previous frame, and the source is a still image. If it is close to, the pull-down pattern may not be detected correctly.
  • the footage starting at the first title will be fed in from black, with the movie company logo appearing and fed out to black.
  • the pull-down phase may not be detected correctly due to the afterimage between frames.
  • the pull-down phase may not be detected correctly even with a material using a noise reducer that reduces the random noise by adding the image of the previous frame and the image of the current frame.
  • the present invention has been made in view of the above-described problems, and has been made in consideration of the above-described problem. In two-pass variable rate encoding, it is possible to determine whether or not an encoding condition by pull-down processing is appropriate before executing the encoding. It is an object of the present invention to provide a simple image encoding method and apparatus.
  • an image encoding method is directed to a two-pass image encoding method for performing encoding based on a pull-down pattern on an input video material subjected to pull-down conversion, It has a measuring step of measuring a pull-down pattern of a video material and a determining step of judging the stability of the measured pull-down pattern.
  • the measured pull-down pattern is compared with the pull-down patterns based on a plurality of assumed initial phases. And selecting an initial phase that gives a pull-down pattern closest to the measured pull-down pattern in each of the pull-down patterns, and selecting a pull-down pattern based on the selected initial phase.
  • an image encoding apparatus provides a two-pass image in which encoding based on a pull-down pattern is performed while performing pull-down processing on an input video material subjected to pull-down conversion.
  • a measuring means for measuring the pull-down pattern of the input video material is compared with the measured pull-down pattern and each of the pull-down patterns based on a plurality of assumed initial phases.
  • Selecting means for selecting an initial phase that gives a pull-down pattern closest to the measured pull-down pattern, and calculating an error of the pull-down pattern based on the selected initial phase with respect to the total number of frames of the video material.
  • the selected error is calculated based on the calculated error and the calculated error.
  • having a stability judging means for judging the stability of pull-down patterns based on the period phase Enko one de ago.
  • FIG. 1 is a diagram showing a configuration example of a conventional video encoding system.
  • FIG. 2 is a diagram for explaining the G 0 P structure.
  • FIG. 3 is a flowchart showing a basic processing procedure of a two-pass code in a conventional video encoding system.
  • FIGS. 4A to 4G are diagrams for explaining examples of processing of surplus bits in the bit allocation calculation.
  • FIG. 5 is a flowchart showing a specific example of the procedure of the bit allocation calculation process.
  • FIG. 6 is a diagram showing an example of a function for converting the sum of the encoding difficulty levels for each GOP “gop-diffj” and the bit allocation amount “gop_target” per GOP at the time of encoding.
  • FIG. 7 is a diagram for explaining 2 ⁇ 3 pull-down conversion.
  • Fig. 8 is a state transition diagram of p-mode [k] in the pull-down.
  • FIG. 9 is a diagram showing an initial phase of a 2-3 pull-down pattern.
  • FIG. 10 is a diagram showing an example of a comparison result between the measured pull-down pattern and the assumed pull-down pattern.
  • FIG. 11 is a flowchart illustrating an example of an algorithm for determining the stability of the pull-down pattern.
  • FIG. 12 is a flowchart showing an example of an algorithm for judging the stability of a pull-down pattern, which is subsequent to FIG. 11.
  • FIG. 13 is a flowchart showing a basic processing procedure of the video encoder according to the present invention.
  • FIG. 14 is a diagram showing a configuration example of a video encoding system according to the present invention. BEST MODE FOR CARRYING OUT THE INVENTION Preferred embodiments of the present invention will be described below with reference to the drawings.
  • the pull-down pattern of the input video material is measured and measured during the two-pass image coding in which the input video material is coded according to the Blu-ray processing.
  • the stability of the pull-down pattern is determined. The stability is determined by comparing the measured pull-down pattern with the pull-down patterns based on a plurality of assumed initial phases, and determining the pull-down pattern closest to the measured pull-down pattern among the pull-down patterns. Select the initial phase that gives the sunset, calculate the error of the bladder pattern based on the selected initial phase with respect to the total number of frames of the video material, and calculate the error based on the calculated error. This is achieved by judging the stability of the pull-down pattern based on the value before encoding.
  • the encoding according to the above-mentioned bundling process or the encoding by the pull-down process is to increase the encoding efficiency mainly by not encoding the repeated field of the pull-down pattern.
  • FIG. 9 shows the initial phase of the 2-3 pull-down pattern described above.
  • the 2-3 pull down when converting frames from film material to video signals is almost always regular. Therefore, it is assumed that the pull-down pattern of the encoded material is regular. Also, considering that the beginning of the encoded material is specified as a chapter and that the encoding must always be performed with P_mode set to 2, the initial phase of the pull-down pattern will be It can be represented by any of the seven patterns shown in this figure.
  • the pull-down patterns of these pull-downs are as follows. If the mode of the initial phase is p-start (0 ⁇ p-start ⁇ 6), the picture mode p-mode [k] of the k-th frame is expressed by the following equation. You.
  • p_mode [k] pd—cycle [pd— start] [k mod 5 + 5] (when k ⁇ 5) Therefore, in the image coding method according to the embodiment of the present invention, a pull-down pattern based on the above seven initial phases assumed for a frame number k (0 ⁇ k ⁇ kend) and a measured pull-down pattern Compare with and select the one with the least error out of the seven.
  • a flow of the video encoding process as an embodiment of the image encoding method according to the present invention will be described.
  • the ps-th pull-down pattern is compared with the measured pull-down pattern, and if they match, pd_match [ps] is increased by one. On the other hand, if the comparison results are different, the number of points at which the phase has started to shift (rising edge of the error) is counted as pd-errnb [ps].
  • the pattern matching rate pd-match-ratio and the error occurrence rate pd_error-ratio for the measured total number of frames frame_nb are calculated as follows.
  • the threshold value for determining the stability of the pull-down pattern of the encoded material is set as follows, for example.
  • the initial value is set as follows.
  • pd_match [ps] 0; (number of times p—mode was the same) pd_errnb [ps] 2 0; (number of times pd—mode changed)
  • FIG. 10 shows an example of a result of comparing a pull-down pattern of an encoder material, which is measured at the time of provisional encoding, with a pull-down pattern based on the above-mentioned seven initial phases in the present embodiment.
  • error is set to 1 when the measurement result and the pull-down pattern are different.
  • pd_match [ps] indicates the number of error is 0, that is, the number of times p_mode is the same.
  • pd—error [ps] is equal to the number of edges where error goes from 0 to 1.
  • Pattern matching ratio pdjnatch— ratio 84.5%
  • the threshold value set above it is determined that the measured pull-down pattern of the material is stable.
  • the one with the largest value of pd-match for the measured value of the pull-down pattern is selected as the initial phase.
  • FIGS. 11 and 12 show a specific example of an algorithm for judging the stability of a pull-down pattern in the video encoding processing as an embodiment of the present invention described above.
  • step S1 of FIG. 11 the number of times pjnode is the same is initialized, pd—match [ps] and pd—error [ps] are initialized to zero.
  • the initial phase of the pull-down pattern represented by ps is 0 ⁇ ps ⁇ 6 because the initial phase is limited to seven as described above.
  • the values of pd—error, pd_error_Dac, pd—match—max, and ps are updated to 0 (this is also done).
  • step S2 the value of the video frame number k is set to 0. It is.
  • step S3 it is determined whether k ⁇ 5. If k ⁇ 5, go to step S4. On the other hand, when k ⁇ 5 is not satisfied, the process proceeds to step S5. This is because in the initial phase of the pull-down pattern shown in FIG. 9, up to the first four frames are singularities.
  • step S8 the value of pd-match [ps] is incremented by 1 and the value of pd_error is set to 0.
  • step S9 the value of pd_error is set to 1.
  • step S12 the frame number k is incremented by one.
  • step S13 it is determined whether the frame number k has exceeded kend. If it is determined that this condition is not satisfied, that is, if the last frame has not been reached, the process returns to step S3 and the above procedure is repeated. On the other hand, if this condition is satisfied, that is, if the last frame has been reached, the process proceeds to step S14, in which the value of ps is incremented by 1 and the same applies to the pull-down pattern based on the next initial phase. Processing is performed.
  • step S15 it is determined whether or not ps> 6, and if this condition is not satisfied, that is, if the processing for all the pull-down patterns based on the seven initial phases described above has not been completed, Returns to step S2 and repeats the above procedure. On the other hand, if this condition is satisfied, that is, if the processing has been completed for all of the above seven pull-down patterns based on the initial phase, the process proceeds to step S16 in FIG. 12 and is set to ps20.
  • step S20 it is determined whether or not ps> 6, that is, whether or not the processing for all of the above seven pull-down patterns based on the initial phase has been completed. Returning to S17, the above procedure is repeated. On the other hand, this condition If the condition is satisfied, the process proceeds to step S21, and the error occurrence rate pd—error—ratio and the non-uniform matching rate pd—match—rat io are calculated.
  • FIG. 13 shows a basic processing procedure of the video encoder according to the present invention, including the calculation of the stability of the pull-down pattern described above.
  • step S31 encoding conditions are input, and in step S32, encoding difficulty (Diff i culty) parameters are input.
  • step S33 pull-down material processing is performed by provisional encoding based on these parameters. Pull down The stability of the pattern is calculated.
  • step S34 the stability of the calculated pull-down pattern is determined. If it is determined that the pattern is not stable, a warning is displayed in step S35, and the encoding is performed in step S36. Is determined by the operator. If it is determined in step S36 that the processing is to be continued under the initial encoding conditions, the process proceeds to step S37. On the other hand, if it is determined in step S34 that the calculated pull-down pattern is stable, Proceed to step S37.
  • step S36 If it is determined in step S36 that encoding is not to be continued, the video encoding process is terminated by performing encoding without pull-down processing in step S44.
  • step S37 detection / processing of a scene change is performed.
  • step S38 a CHAPTER boundary process for converting the boundary into a sequence of P-pictures and I-pictures is performed.
  • step S39 interpolation / correction processing of encoding difficulty (Difficulty) is performed.
  • step S40 the number of target bits is calculated.
  • step S41 an address (ADDRESS) is calculated.
  • step S42 tg-rate is calculated.
  • step S43 a control file for the encoder is created, and the video encoder processing ends.
  • FIG. 14 shows a configuration example of a video encoding system as an embodiment of the image encoding device according to the present invention.
  • This video encoding system is used for applying the image encoding method according to the present invention described above to compress and encode video information for DVD (Digital Versatile Disk, Digital Video Disk) and to perform authoring or the like.
  • the basic configuration is almost the same as the configuration of the conventional video encoding system shown in FIG. Can be
  • the main controller 11 is composed of a computer assigned to the video encoding system, performs data communication with a supervisor 3 connected via a network 2, and controls the entire video encoding system. Control the operation of.
  • the main controller 11 receives control from the supervisor 3 under the control of a graphical user interface (GUI: Graphical User Interface) unit 14 and operates an unillustrated operator. The evening operation is accepted, and the bit assignment section 15, the encoder control section 16, and the VTR control section 17 managed by the GUI section 14 allow the encoder 12, video tape recorder (VTR) Control the operation of 10. Accordingly, the main controller 11 encodes the material to be processed in accordance with the encoding condition notified from the supervisor 3 and notifies the supervisor 3 of the processing result. Further, the main controller 11 can receive the setting of the operating system through the GUI unit 14 and change the above detailed conditions of the encoding.
  • GUI Graphical User Interface
  • the GUI section 14 of the main controller 11 includes a bit allocation program “BIT_ASSIGN” of the bit assignment section 15, an encoder control program “CTRL_ENC” of the encoder control port section 16, and
  • the VTR control section 17 manages three VTR control programs.
  • bit assigning unit 15 determines the conditions of the encoding process in units of frames according to the encoded file “v.enc” notified from the supervisor 3, and converts the control data based on these conditions into the file format “CTL.
  • the control section 16 is notified by filej.
  • bit assignment section 15 sets the bit allocation in the encoding process, and changes the set conditions according to the operation of the operator.
  • bit assignment section 15 reads the address data on the RAID 4. “v.adr” is notified to the supervisor 3 together with information “vxxx.aui” such as the data amount necessary for the multiplexing process in the subsequent stage.
  • the encoder control unit 16 controls the operation of the encoder 12 via the Ethernet ETHER or the like according to the control file “CTL file” notified from the bit assignment unit 15. Further, the encoder control unit 16 notifies the bit assignment unit 15 of the encoding difficulty level "dif-ficultyj" required for the encoding process to the bit assigning unit 15 in frame units, and the video decoding unit D2 Notify the bit assignment section 15 of the recorded address of the recorded RAID 4 address — “v.adr” and the data “vxxx. Aui” required for the subsequent multiplexing process.
  • the VTR control section 17 controls the operation of the video tape recorder (VTR) 10 via an RS-422 (9-pin remote) or the like according to the edit list notified from the supervisor 3, and performs a desired editing target. Play the source material.
  • the video tape recorder (VTR) 10 reproduces the video data D1 recorded on the magnetic tape in accordance with the edit list notified from the supervisor 3 via the main controller 11, and outputs the video data D1 to be processed.
  • SDI ”,“ REF V ”, and“ TIME CODEj ” are output to encoder 12.
  • VTR 10 usually a digital VTR is used.
  • the encoder 12 switches its operation according to the conditions notified from the supervisor 3 via the main controller 11, and converts the video data D 1 output from the VTR 10 into the MPEG (Moving Picture Experts Group) method. Compression encoding.
  • the encoder 12 notifies the main controller 11 of the result of the encoding process, and the main controller 11 controls the encoding condition in the overnight compression and generates Controls the amount of bits.
  • the main controller 11 can grasp the bit amount generated by the overnight compression in frame units.
  • the encoder 12 simply compresses the video data from the VTR 10 at the time of processing of the pre-encode condition setting in the two-pass encoding (at the time of the provisional encoding), and processes the processing result. Only the main controller 11 is notified, but at the time of the final data compression processing (at the time of this encoding), the compressed video data D 2 is recorded in RAID 4, and Further, the main controller 11 is notified of the address at which the data was recorded, the data amount, and the like.
  • the monitor device 13 is configured to monitor the video data D2 compressed by the encoder 12 overnight. With this monitor device 13, in this video encoding system, a so-called preview can be performed, in which the operating system confirms the result of the data compression process as needed. The operator can operate the main controller 11 based on the preview result to change the encoding conditions in detail.
  • the pull-down processing is specified as a condition of the two-pass variable rate code. If this is specified, the suitability of the material to be encoded can be determined before executing this encoding, so work such as reviewing the encoding conditions that occur when performing DVD authoring, etc. Man-hours can be reduced. In other words, in a two-pass variable rate encoder with 2-3 pull-down, at the time of pre-encoding (temporary encoding), along with measuring the encoding difficulty indicating the complexity of the material, the stability of the pull-down pattern is determined to determine the stability of the encoder material. Since the suitability is determined before this code, it is possible to promptly review the encoding conditions at an early stage.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Television Systems (AREA)

Abstract

The stability of a pulldown pattern is calculated in step S33 based on the encoding conditions and the encoding difficulty parameter of a material which are inputted in steps S31, S32, and the stability is judged in step S34. If it is juged that the pulldown pattern is not stable, a warning is indicated in step S35 and it is decided whether or not the encoding under the initial conditions are to be continued in step S36. If it is decided that the encoding is not to be continued, an encoding etc. without a pulldown processing is performed in step S44. If it is decided that the encoding to be continued or if it is decided that the the pulldown pattern is stable in step S34, a scene change detection/processing, a chapter boundary processing, interpolation/correction of the encoding difficulty, calculation of target number of bits, and address calculation are performed in steps S37-S41, the target rate is calculated in step S42, and an encoder control file is produced in step S43, finishing the whole processing. With this constitution, an image encoding method and device by which it can be judged whether the encoding conditions are proper or not before two-pass variable rate encoding is performed by the pulldown processing.

Description

明 細 書 画像符号化方法及び装置 技 術 分 野 本発明は、 ビデオ素材を符号化する画像符号化方法及び装置に関 し、 特に、 プルダウン変換された入力ビデオ素材のプルダウンパ夕 ーンに基づいて符号化を行う画像符号化方法及び装置に関するもの である。 背 景 技 術 ビデオ情報を D V D ( D igital Versati le Disk, Digital Video Disk) やビデオ C Dのようなパッケージメディァに蓄積する際に、 ビデオ情報に圧縮符号化処理を施すェンコ一ドシステムでは、 まず、 ビデオ素材の画像の符号化難易度 (diff iculty) を測定し、 次に、 その符号化難易度に基づいてパッケ一ジメディァの記録容量の範囲 内の与えられたバイ ト数に収まるように、 各ビデオ情報のフレーム ごとにビッ ト配分 (B it ass ign) 処理を行うエンコード方法が一般 に採用されている。 以下、 このエンコード方法を 2パスェンコ一デ ィ ング方法という。  TECHNICAL FIELD The present invention relates to an image encoding method and apparatus for encoding video material, and more particularly to a video encoding method and apparatus based on a pull-down pattern of an input video material that has been subjected to pull-down conversion. TECHNICAL FIELD The present invention relates to an image encoding method and apparatus for performing encoding. Background technology When video information is stored in a package media such as a DVD (Digital Versatile Disk, Digital Video Disk) or a video CD, an encoding system that performs compression coding on the video information first requires The encoding difficulty (diff iculty) of the image of the video material is measured, and then, based on the encoding difficulty, each is set so as to be within a given number of bytes within the storage capacity of the package media. An encoding method that performs bit allocation processing for each frame of video information is generally adopted. Hereinafter, this encoding method is referred to as a two-pass encoding method.
図 1は、 ビデオ情報を圧縮符号化して D V D等のォーサリングな どを行うために用いられる、 従来のビデオェンコ一ドシステムの構 成例を示している。 スーパーバイザ 1 0 3は、 ビデオエンコー ドシステムの全体を管 理するものであり、 ビデオ, オーディオ, メニューなどの各ェンコ ードシステムにェンコ一ド条件を与え、 ェンコ一ド結果の報告を受 ける。 この例では、 ファイル 「v.enc」 によってビデオエンコード 条件が指定され、 ビデオェンコーダ側からはエンコード結果のビッ トス ト リームが書き込まれた R A I D (Redundant Arrays of Inexpensive Disks) 1 04上のアドレス 「v.adr」 と、 ビッ トス ト リームをマルチプレックスする際に必要なデ一夕 「vxxx.aui」 が報 告される。 FIG. 1 shows an example of the configuration of a conventional video encoding system used for authoring a DVD or the like by compressing and encoding video information. The supervisor 103 manages the entire video encoding system, gives encoding conditions to each encoding system such as video, audio, and menu, and receives a report of the encoding result. In this example, the video encoding conditions are specified by the file “v.enc”, and the video encoder outputs the address “v” on the RAID (Redundant Arrays of Inexpensive Disks) 104 where the encoded bitstream is written. .adr ”and“ vxxx.aui ”required for multiplexing bitstreams are reported.
主コン トローラ 1 1 1は、 ネッ トワーク 1 0 2を介して接続され るスーパ一バイザ 1 0 3との間のデータ通信により、 このビデオェ ンコ一 ドシステム全体の動作を制御する。  The main controller 11 1 controls the operation of the entire video encoder system by data communication with a supervisor 103 connected via a network 102.
具体的には、 主コン トローラ 1 1 1は、 グラフィカルユーザ一ィ ン夕ーフエース (GU I : Graphical User Interface) 部 1 1 4の 管理により、 スーパ一バイザ 1 0 3からの制御を受け付けると共に、 ォペレ一夕の操作を受け付け、 この GU I部 1 1 4により管理され るビッ トアサイン部 1 1 5, エンコーダコン トロール部 1 1 6, V TRコン トロール部 1 1 7により、 エンコーダ 1 1 2 , ビデオテ一 プレコーダ (VTR) 1 1 0の動作を制御する。 これにより主コン トロ一ラ 1 1 1は、 スーパーバイザ 1 0 3から通知されたェンコ一 ド条件に従って、 処理対象の素材を符号化処理し、 その処理結果を スーパ一バイザ 3に通知する。 さらに、 主コントローラ 1 1 1は、 GU I部 1 1 4を介してオペレー夕の設定を受け付けて、 上記の符 号化の詳細な条件を変更できるようにされている。  More specifically, the main controller 111 receives control from the supervisor 103 and manages it through the management of a graphical user interface (GUI) section 114. One night operation is accepted, and the bit assignment unit 115, encoder control unit 116, and VTR control unit 117 managed by the GUI unit 114 provide the encoder 112, video Controls the operation of the precoder (VTR) 110. Accordingly, the main controller 111 encodes the material to be processed in accordance with the encoding condition notified from the supervisor 103 and notifies the supervisor 3 of the processing result. Further, the main controller 111 can receive the setting of the operator via the GUI unit 114, and can change the above detailed conditions of the encoding.
上記の主コン トローラ 1 1 1の G U I部 1 1 4は、 ビッ トアサイ ン部 1 1 5のビッ ト配分プログラム 「BIT— ASSIGNj , エンコーダコ ン トロ一ル部 1 1 6のエンコーダコン トロールプログラム 「CTRL— ENC」 および VTRコン ト口一ル部 1 1 7の 丁1^コン トロールプ ログラムの 3つのプログラムを管理している。 The GUI section 1 1 4 of the main controller 1 1 1 Bit allocation program “BIT— ASSIGNj” for encoder section 115, encoder control program “CTRL—ENC” for encoder control section 116, and VTR control section section 117 It manages three control programs.
また、 ビッ トアサイ ン部 1 1 5は、 スーパーバイザ 1 03から通 知されるエンコード条件のファイル 「v.enc」 に従って符号化処理 の条件をフレーム単位で決定し、 この条件による制御デ一夕をファ ィル形式 「CTL filej によりコン トロール部 1 1 6に通知する。 このとき、 ビッ トアサイン部 1 1 5は、 符号化処理におけるビッ ト配分 (ビヅ トアサイン) を設定し、 さらに設定された条件をオペ レー夕の操作に応じて変更する。 さらに、 ビッ トアサイン部 1 1 5 は、 デ一夕圧縮されたビデオデ一夕 D 2が RA I D 1 04に記録さ れると、 そのビデオデータ D 2が書き込まれた; RA I D 1 04上の アドレスのデータ 「v.adr」 を、 後段における多重化処理に必要な デ一夕量等の情報 「vxxx.aui」 と共にスーパ一バイザ 1 03に通知 する。  Also, the bit assigning unit 115 determines the encoding processing conditions in frame units according to the encoding condition file “v.enc” notified from the supervisor 103, and the control data based on these conditions is filed. In this case, the control unit 116 is notified by the CTL filej. At this time, the bit assignment unit 115 sets the bit allocation (bit assignment) in the encoding process, and further sets the set conditions. In addition, the bit assignment section 115 writes the video data D2 when the video data D2 that has been compressed is recorded in the RA ID 104. Notify the supervisor 103 of the address data “v.adr” on the RA ID 104 together with the information “vxxx.aui” such as the amount of data required for the multiplexing process in the subsequent stage.
エンコーダコン トロ一ル部 1 16は、 ビッ トアサイン部 1 1 5か ら通知される制御ファイル 「CTL filej に従ってエンコーダ 1 1 2 の動作を制御する。 さらに、 エンコーダコン トロール部 1 1 6は、 符号化処理に要する符号化難易度 「difficulty」 のデータをフレー ム単位でビッ トアサイン部 1 1 5に通知し、 R A I D 1 04にビデ ォデ一夕 D 2が記録されると、 その記録アドレスのデ一夕 「v.adr」 , 後の多重化処理に必要なデ一夕 「vxxx. auij をビッ トアサイン部 1 1 5に通知する。  The encoder control unit 116 controls the operation of the encoder 112 in accordance with the control file “CTL filej notified from the bit assignment unit 115. Further, the encoder control unit 116 controls the encoding The data of the encoding difficulty "difficulty" required for the processing is notified to the bit assigning unit 115 in frame units, and when the video data D2 is recorded in the RAID 104, the data of the recording address is deleted. In the evening, “v.adr” is notified to the bit assigning unit 115 of “vxxx.auij”, which is necessary for the subsequent multiplexing processing.
V T Rコン トロール部 1 1 7は、 スーパーバイザ 3から通知され る編集リス 卜に従ってビデオテープレコーダ (V T R ) 1 1 0の動 作を制御し、 所望の編集対象の素材を再生する。 The VTR control section 1 17 is notified from the supervisor 3 The operation of the video tape recorder (VTR) 110 is controlled in accordance with the editing list to be played, and the desired material to be edited is reproduced.
ビデオテープレコーダ (V T R ) 1 1 0は、 主コン トローラ 1 1 The video tape recorder (VTR) 110 is the main controller.
1を介してスーパ一バイザ 1 0 3から通知される編集リス 卜に従つ て、 磁気テープに記録されたビデオデータ D 1を再生してェンコ一 ダ 1 1 2に出力する。 In accordance with the edit list notified from the supervisor 103 via 1, the video data D 1 recorded on the magnetic tape is reproduced and output to the encoder 112.
エンコーダ 1 1 2は、 スーパーバイザ 1 0 3から主コン トローラ Encoders 1 and 2 are connected to the main controller from supervisor 103
1 1 1 を介して通知される条件に従って動作を切り換え、 V T R 1The operation is switched according to the condition notified via 1 1 1 and VTR 1
1 0から出力されるビデオデータ D 1を、 M P E G (Moving Picture Experts Group) の手法により圧縮符号化する。 The video data D 1 output from 10 is compression-coded by the method of M PEG (Moving Picture Experts Group).
このとき、 エンコーダ 1 1 2は、 符号化処理の結果を主コン ト口 —ラ 1 1 1に通知し、 主コン トローラ 1 1 1は、 そのデータ圧縮に おける符号化の条件を制御し、 発生するビッ ト量を制御する。 これ により、 主コン トローラ 1 1 1は、 データ圧縮により発生するビッ ト量をフレーム単位で把握できる。  At this time, the encoder 1 12 notifies the main controller 1 1 1 of the result of the encoding process, and the main controller 1 1 1 1 controls the encoding condition in the data compression and generates the Control the amount of bits to be applied. As a result, the main controller 111 can grasp the amount of bits generated by data compression in frame units.
また、 エンコーダ 1 1 2は、 2パスエンコードにおける事前のェ ンコード条件設定の処理時 (仮エンコード時) には、 単にビデオデ —夕 D 1をデータ圧縮して処理結果を主コン トローラ 1 1 1に通知 するだけであるが、 最終的なデ一夕圧縮処理時 (本エンコード時) には、 圧縮処理されたビデオデ一夕 D 2を R A I D 1 0 4に記録し、 さらにそのデータが記録されたァドレス, デ一夕量等を主コン ト口 ーラ 1 1に通知する。  In addition, the encoder 112 simply compresses the video data D 1 during the processing of the pre-encoding condition setting in the two-pass encoding (during provisional encoding), and sends the processing result to the main controller 111. At the time of the final data compression process (during actual encoding), the compressed video data D2 is recorded in RAID 104, and the address where the data was recorded is also recorded. The main controller 11 is notified of the amount of data and the amount of data.
モニタ装置 1 1 3は、 エンコーダ 1 1 2によりデータ圧縮された ビデオデ一夕 D 2をモニタできるように構成される。 このモニタ装 置 1 1 3により、 このビデオエンコードシステムでは、 オペレータ がデータ圧縮処理の結果を必要に応じて確認する、 いわゆるプレビ ュ一を行うことができる。 そして、 ォペレ一夕が、 このプレビュー 結果に基づいて主コン トローラ 1 1 1を操作して、 符号化の条件を 詳細に変更できるようにされている。 The monitor device 113 is configured to monitor the video data D2 that has been compressed by the encoder 112. With this monitor device 113, this video encoding system allows the operator Can check the result of the data compression processing as necessary, that is, perform a so-called preview. Then, the operator can operate the main controller 111 based on the preview result to change the encoding conditions in detail.
上述したように、 DVDでは、 ビデオデ一夕の圧縮方式として M PEG (Moving Picture Experts Group) を採用している。  As described above, the DVD employs the Moving Picture Experts Group (MPEG) as a compression method for video decoding.
MP E Gは、 動き補償予測による時間方向の冗長度を除去するこ とによりデータ圧縮する方式であり、 フ レーム内だけで符号化され る I (Intra) ピクチャ, 過去の画面から現在を予測して符号化さ れる P (Predictive) ピクチャ, 過去の画像と未来の画像とから現 在を予測して符号化される B (Bidirectionally Predictive) ピク チヤの 3種類の符号化画像が用いられる。  MPEG is a method of compressing data by removing the redundancy in the time direction by motion compensation prediction. It predicts the current from I (Intra) pictures coded only within the frame and past screens. Three types of coded images are used: P (Predictive) pictures to be coded, and B (Bidirectionally Predictive) pictures, which are coded by predicting the current from past and future images.
また、 これらの画像は、 Iピクチャを必ず 1つ含むまとまりであ る GOP (Group of Pictures) とされる。  In addition, these images are defined as a GOP (Group of Pictures), which always includes one I-picture.
図 2は、 G 0 P構造の一例を示している。  FIG. 2 shows an example of the G0P structure.
この例では、 1つの GO Pを構成するピクチャ (フレーム) の数 Nが 1 5である。 GOPの各ピクチャが表示される順序は、 符号化 される順序とは異なっており、 表示順における GO Pの先頭のピク チヤは、 Iピクチャの前であって Pピクチャまたは Iピクチャの次 にある Bビクチャである。 また、 表示順における G〇 Pの最後は、 次の Iピクチャの前にある最初の Pピクチャである。  In this example, the number N of pictures (frames) constituting one GOP is 15. The order in which the pictures of the GOP are displayed is different from the order in which they are coded, and the first picture of the GOP in the display order is before the I picture and after the P picture or I picture. It is a B victim. The last of G〇P in the display order is the first P picture before the next I picture.
次に、 2パスエンコードについて、 図 1に例示のビデオェンコ一 ドシステムの構成を参照しながら説明する。  Next, two-pass encoding will be described with reference to the configuration of the video encoding system illustrated in FIG.
図 3は、 上記のビデオェンコ一ドシステムにおける 2パスェンコ ―ドの基本的な処理手順を示している。 まず、 ステップ S 5 1で、 スーパーバイザ 1 0 3からネッ トヮ一 ク 1 0 2を経由して、 ビデオ情報に割り当てられるビッ ト総量ゃ最 大レートなどのエンコード条件 「v . enc」 が与えられ、 エンコーダ コン トロール部 1 1 6はこのェンコ一ド条件に従って設定される。 次に、 ステップ S 5 2で、 エンコーダコン トロール部 1 1 6が、 エンコーダ 1 1 2を使ってェンコ一ド素材の符号化難易度 (diff iculty) を測定する。 ここでは、 素材の各画素の D C値や動きべク ト ル量 M Eも併せて測定される。 そして、 これらの測定結果に基づい てフアイルが作成される。 FIG. 3 shows a basic processing procedure of the two-pass code in the video code system described above. First, in step S51, the encoding conditions "v.enc" such as the total amount of bits allocated to video information and the maximum rate are given from the supervisor 103 via the network 102. The encoder control section 116 is set according to this encoder condition. Next, in step S52, the encoder control unit 116 measures the encoding difficulty (diff iculty) of the encoding material using the encoder 112. Here, the DC value of each pixel of the material and the motion vector amount ME are also measured. Then, a file is created based on these measurement results.
実際の符号化難易度の測定は、 以下のように行われる。  The actual measurement of the coding difficulty is performed as follows.
ェンコ一ド素材となるビデオ情報は、 マス夕一テープであるディ ジ夕ルビデオカセッ 卜から V T R 1 1 0により再生される。  Video information to be used as an encoding material is reproduced by a VTR 110 from a digital video cassette, which is a master tape.
エンコーダコン ト口ール部 1 1 6は、 エンコーダ 1 1 2を介して、 V T R 1 1 0により再生されたビデオ情報 D 1の符号化難易度を測 定する。 ここでは、 符号化の際に量子化ステップ数を固定値に設定 して発生ビッ ト量が測定される。 動きが多く、 高い周波数成分が多 い画像では発生ビッ ト量が多くなり、 静止画や平坦な部分が多い画 像では発生ビッ ト量が少なくなる。 この発生ビッ ト量の大きさを符 号化難易度としている。  The encoder control unit 116 measures the encoding difficulty of the video information D1 reproduced by the VTR 110 via the encoder 112. Here, the number of generated bits is measured by setting the number of quantization steps to a fixed value during encoding. The amount of generated bits increases in images with many motions and many high frequency components, and decreases in still images and images with many flat parts. The amount of generated bits is defined as the encoding difficulty.
次に、 ステップ S 5 3では、 ステップ S 5 1で設定されたェンコ —ド条件によってステップ S 5 2で測定された、 各ピクチャの符号 化難易度の大きさに応じて、 エンコーダコン トロール部 1 1 6が、 ビッ トアサイン部 1 1 5内のビッ ト配分計算プログラム 「B IT— ASSIGNj を実行し、 割り当てビッ ト量 (夕一ゲッ ト量) の配分計算 を行う。 そして、 ステップ S 5 4で、 上記のビッ ト配分計算の結果を使つ て仮エンコードを行い、 エンコーダ 1 1 2に内蔵されている口一力 ルデコーダ出力の画質によって、 本ェンコ一ドを実行するかどうか をオペレー夕に判断させるようにする。 Next, in step S53, the encoder control unit 1 according to the magnitude of the encoding difficulty of each picture measured in step S52 according to the encoding condition set in step S51. 16 executes the bit allocation calculation program "BIT-ASSIGNj" in the bit assignment section 115 to calculate the allocation of the allocated bit amount (evening amount). Then, in step S54, provisional encoding is performed using the result of the above-described bit allocation calculation, and this encoding is executed according to the image quality of the output decoder output from the built-in encoder 112. Or not at the time of the operation.
実際には、 上記のビッ ト配分によるビヅ ト ス ト リームを R A I D 1 0 4に出力しないで、 オペレー夕が、 任意の処理範囲を指定でき るモードであるプレビュー (Preview) モードで画質が確認される。 そして、 ステップ S 5 5で、 画質評価が行われ、 画質に問題があ る場合 (N G ) にはステップ S 5 6に進み、 問題がある部分のビッ トレートを上げたりフィルターレベルを調整するといつた画質調整 のためのカス夕マイズ作業を行った後に、 ステップ S 5 7でビッ ト 配分再計算が実行される。  In practice, the bit stream is not output to the RAID 104 with the bit allocation described above, but the image quality is checked in the Preview mode, which is a mode in which the operator can specify an arbitrary processing range. Is done. Then, in step S55, the image quality is evaluated. If there is a problem with the image quality (NG), the process proceeds to step S56, where the bit rate of the problematic part is increased or the filter level is adjusted. After performing customization work for image quality adjustment, recalculation of bit allocation is performed in step S57.
その後、 ステップ S 5 4に戻り、 カス夕マイズされた部分がプレ ビューされ、 ステップ S 5 5で画質が確認される。 ここで、 全ての 部分の画質が良好であればステップ S 5 8に進み、 エンコーダ 1 1 2によって、 ステップ S 5 7で再計算されたビッ ト配分による素材 全体についてのェンコ一ドが実行される。  Thereafter, the process returns to step S54, where the customized portion is previewed, and the image quality is confirmed in step S55. Here, if the image quality of all parts is good, the process proceeds to step S58, and the encoder 1 12 executes encoding for the entire material by the bit allocation recalculated in step S57. .
一方、 ステップ S 5 5で、 画質に問題がないと判断された場合に は、 そのままステップ S 5 8に進み、 エンコーダ 1 1 2により、 ス テツプ S 5 3で計算されたビッ ト配分によるェンコ一ド処理が実行 される。  On the other hand, if it is determined in step S55 that there is no problem with the image quality, the process directly proceeds to step S58, where the encoder 112 determines the encoder based on the bit allocation calculated in step S53. Is executed.
そして、 ステップ S 5 9で、 ェンコ一ド結果であるビッ トス ト リ —ムが S C S I ( Smal l Computer System Interface ) 等を介して R A I D 1 0 4に書き込まれる等の後処理が行われ、 2パスェンコ ―ド処理が終了する。 ステップ S 5 8におけるエンコー ドの実行後、 ビデオエンコーダ コン トロール部 1 1 6は、 上述したようなェンコ一ド結果の情報を ネッ トワーク 1 0 2経由でスーパーバイザ 1 0 3に報告する。 Then, in step S59, post-processing such as writing the bit stream as a result of encoding to RAID 104 via SCSI (Small Computer System Interface) or the like is performed. -The processing ends. After the execution of the encoding in step S58, the video encoder control unit 116 reports the information of the encoding result as described above to the supervisor 103 via the network 102.
なお、 この図 3の各ステップのうち、 ステップ S 5 2, ステップ S 5 4およびステップ S 5 8を除く各ステップの処理は、 オフライ ンで行われる。  Note that among the steps in FIG. 3, the processing of each step except for step S52, step S54, and step S58 is performed offline.
次に、 上述した 2パスエンコーディ ングにおいて、 ビッ トアサイ ン部 1 1 5で実行されるビッ ト配分計算についてさらに説明する。 図 4 A〜図 4 Gは、 ビッ ト配分計算における余り ビッ トの処理例 を示している。  Next, in the above-described two-pass encoding, the bit allocation calculation performed by the bit assigning unit 115 will be further described. FIGS. 4A to 4G show examples of processing of surplus bits in the bit allocation calculation.
まず、 ディジタルビデオディスク (D V D ) などのパッケージメ ディァの記録容量のうちのビデオ情報に割り当てられるビッ ト総量 「QTY_BYTES」 (図 4 A ) および最大ビッ トレート 「MAXMTE」 が、 スーパーバイザ 1 0 3から指定される。  First, the supervisor specifies the total bit amount “QTY_BYTES” (Fig. 4A) and the maximum bit rate “MAXMTE” allocated to video information in the recording capacity of package media such as digital video discs (DVDs). Is done.
これに対して、 エンコーダコン トロール部 1 1 6は、 ビッ トアサ イ ン部 1 1 5内のビッ ト配分計算プログラム 「B I T_ASS I GN」 を実行 し、 まず、 最大ビッ トレート 「MAXRATE」 以下になるように制限が 加えられた総ビッ ト数 「USB_BYTES」 を求め (図 4 B ) 、 この値か ら G O Pのヘッダ (Header) に必要なビッ ト数 「T0TA HEADERj を 引いた値と、 素材全体のフレーム総数から夕ーゲッ ト数の総和の目 標値となる 「 SUPPLY— BYTES」 を算出する (図 4 C ) 。  On the other hand, the encoder control section 116 executes the bit allocation calculation program "BIT_ASSIGN" in the bit assignment section 115, and first, the bit rate becomes less than the maximum bit rate "MAXRATE". The total number of bits “USB_BYTES”, which is limited as described above, is calculated (Fig. 4B), and the value obtained by subtracting the number of bits “T0TA HEADERj” required for the GOP header (Header) from this value is calculated. From the total number of frames, calculate “SUPPLY—BYTES”, which is the target value of the total number of evening targets (Fig. 4C).
そして、 この 「SUPPLY_BYTES」 の大きさに収まるように、 各ピク チヤへの割当てビッ ト量 (夕ーゲヅ ト量) が配分される。 全てのピ クチャへの割当てビッ ト量の総和を 「TARGET_BYTES」 とすると、 図 4 D〜図 4 Fに示すように、 夕ーゲッ ト数の総和の目標値 「SUPPLY — BYTES」 から、 上記の 「TARGET— BYTES」 を引いた値が、 ビッ ト配分 の際の余り (Remain) を示す量 「REMAIN_BYTES」 となる。 Then, the bit amount (evening gate amount) allocated to each picture is allocated so as to be within the size of this “SUPPLY_BYTES”. Assuming that the total amount of bits allocated to all pictures is “TARGET_BYTES”, the target value “SUPPLY — BYTES ”minus the above“ TARGET—BYTES ”is the amount“ REMAIN_BYTES ”that indicates the remainder (Remain) in bit allocation.
そして、 図 4 Gに示すように、 「TARGET_BYTES」 と Headerの和が 「TARGET_OUT_BYTES」 とされる。  Then, as shown in FIG. 4G, the sum of “TARGET_BYTES” and the Header is “TARGET_OUT_BYTES”.
図 5は、 図 3のステップ S 5 3における、 ビッ ト配分計算処理の 手順の一具体例を示している。  FIG. 5 shows a specific example of the procedure of the bit allocation calculation process in step S53 of FIG.
まず、 ステップ S 6 1で、 前述したようにスーパ一バイザ 3から 送られるビッ ト総量 「QTY_BYTES」 と最大ビッ トレ一ト 「MAXRATE」 が入力される。  First, in step S61, as described above, the total bit amount “QTY_BYTES” and the maximum bit rate “MAXRATE” sent from the supervisor 3 are input.
次に、 ステップ S 6 2で、 図 3のステップ S 5 2で作成された符 号化難易度 (d i ff i cu lty) の測定結果のファイルがそのまま読み込 まれる。  Next, in step S62, the file of the measurement result of the encoding difficulty (diffi cu lty) created in step S52 of FIG. 3 is read as it is.
そして、 ステップ S 6 3で、 符号化難易度と共に測定された各画 像の D C値や動きべク トル量 M Eの大きさのパラメ一夕の変化量か ら、 シーンが変化するポイン トが検出される。  Then, in step S63, the point at which the scene changes is detected from the DC value of each image measured together with the encoding difficulty and the amount of change in the parameter of the motion vector ME over time. Is done.
なお、 このステップ S 6 3におけるシーンチェンジの検出/処理 には、 本件出願人がすでに日本国特許出願の特願平 8— 2 7 4 0 9 4号の明細書および図面にて開示した 「映像信号処理装置」 におけ るシーンチェンジ点を検出するための処理を適用できる。 この 「映 像信号処理装置」 は、 映像信号の各フレームの直流レベルを検出し、 この直流レベルを曲線近似して得られる誤差値から、 その映像信号 のシ一ンチェンジのフレームを検出してシーンチェンジ点を明らか にするというものである。 そして、 シーンがチェンジしたとして検 出されたポイン トでは、 Pピクチャが I ピクチャに変更されて、 画 質改善が図られる。 次に、 ステップ S 6 4では、 チャプター (CHAPTER) 境界処理が 行われる。 D V D再生装置でのチャプターサーチ時には、 再生され るビクチャが、 特定されないピクチヤからジャンプしてく ることに なる。 その場合でも再生画像が乱れないようにするため、 このチヤ プ夕境界処理によってチャプターの位置が必ず G◦ Pの先頭になる ようにピクチャタイプが変更されたり、 G 0 P長が制限される。 ステップ S 6 5では、 上記の一連の作業の結果として変更された、 I ピクチャ, Pピクチャ, Bピクチャなどのピクチャタイプに合わ せた符号化難易度 (D ifficulty) の値に対して補間/補正が行われ る。 The detection / processing of the scene change in step S63 is based on the “video” disclosed in the specification and drawings of Japanese Patent Application No. 8-274904, which was already filed by the present applicant. Processing for detecting a scene change point in the “signal processing device” can be applied. This "video signal processing device" detects the DC level of each frame of the video signal, and detects a scene change frame of the video signal from an error value obtained by approximating the DC level with a curve. This is to clarify the change points. At the point detected as a scene change, the P picture is changed to an I picture to improve the picture quality. Next, in step S64, a chapter (CHAPTER) boundary process is performed. At the time of a chapter search in a DVD playback device, the reproduced picture jumps from an unspecified picture. In this case, in order to prevent the reproduced image from being disturbed, the picture type is changed or the G0P length is limited by this chapter boundary processing so that the chapter position is always at the top of G • P. In step S65, interpolation / correction is performed on the value of the coding difficulty (D ifficulty) corresponding to the picture type such as I picture, P picture, and B picture, which has been changed as a result of the above series of operations. Is performed.
これは、 D V Dでは、 1 G O Pのデコード時の、 表示される最大 のフィールド数が制限されていることから、 ピクチャタイプの変更 に伴って G O P構造が変化したことにより 1 G O Pの長さがこの制 限を越えることがあるためである。 そのような場合には、 制限を満 たすように、 Pピクチャを I ピクチャに変更して G O P長が短くさ れる G◦ P制約処理が行われる。  This is because the maximum number of fields to be displayed when decoding one GOP is limited in DVDs, and the length of one GOP is limited by the change in the GOP structure due to the change in picture type. This is because the limit may be exceeded. In such a case, G • P constraint processing is performed in which the P picture is changed to an I picture to shorten the GOP length so as to satisfy the restriction.
ステップ S 6 6では、 ステップ S 6 5における補間/補正処理に よって得られた符号化難易度、 およびェンコ一ドされる素材全体に 与えられたビッ ト数 「 SUPPLY— BYTES」 に応じて、 各ピクチャごとの ターゲッ トビッ ト (Target bit) 数が計算される。  In step S66, according to the encoding difficulty obtained by the interpolation / correction processing in step S65 and the number of bits “SUPPLY—BYTES” given to the entire material to be encoded, The number of target bits for each picture is calculated.
そして、 ステップ S 6 7で、 ェンコ一ド結果のビッ トス ト リーム を書き込む際の R A I D 4のアドレス (ADDRESS) を計算した上で、 ステップ S 6 8に進み、 エンコーダ用のコン ト口一ルファィルが作 成されて処理が終了する。  Then, in step S67, after calculating the address (ADDRESS) of RAID 4 when writing the bit stream of the encoding result, the process proceeds to step S68, and the control file for the encoder is obtained. Created and the process ends.
上記のような手順により、 素材の符号化難易度 (Diff iculty) お よび素材全体に与えられたビッ ト数 「 SUPPLY— BYTES」 に応じて、 各 ピクチャごとの夕ーゲッ トビヅ ト数が計算され、 エンコーダ用のコ ン トロールファィルが作成される。 By the above procedure, the difficulty of encoding the material (Diff iculty) The number of evening target bits for each picture is calculated according to the number of bits “SUPPLY—BYTES” given to the entire material and a control file for the encoder is created.
以下では、 このような一連のビッ ト配分の手順について、 さらに 詳しく説明する。 ここでは、 ビッ ト配分の計算例として、 まず G O Pを単位としてビッ ト量が配分され、 その後、 各 G O P内で各ピク チヤの符号化難易度 (Difficulty) に応じたビッ ト配分が行われる ものとしており、 各 G 0 Pごとの符号化難易度の和である 「gop— di f f」 に応じて、 エンコード時の G 0 P単位のビッ ト割当て量 「gop— targetj が配分される。  In the following, such a series of bit allocation procedures will be described in more detail. Here, as an example of calculating the bit allocation, the bit amount is first allocated in GOP units, and then the bit allocation is performed within each GOP according to the encoding difficulty (Difficulty) of each picture. According to “gop-diff” which is the sum of the encoding difficulty for each G0P, the bit allocation amount “gop-targetj” in G0P units at the time of encoding is allocated.
図 6は、 この GO Pごとの符号化難易度の和 「gop— diffj とェン コード時の G〇 P単位のビッ ト割当て量 「gop_target」 とを変換す るための、 最も簡単な関数の例を示している。  Figure 6 shows the simplest function for converting the sum of the encoding difficulty for each GOP “gop—diffj” and the bit allocation “gop_target” in G〇P units at the time of encoding. An example is shown.
この例では、 「gop_target」 を Y とし、 「gop— diff」 を X として、 Y = AX + B  In this example, "gop_target" is Y, "gop—diff" is X, and Y = AX + B
という形で表される評価関数が用いられる。 Is used.
許容される最大ビッ トレ一ト以下に制限された総ビッ ト数 「USB— BYTES j は、  Total number of bits limited to less than the maximum bit rate allowed "USB—BYTES j is
USB— BYTES = min (QTY— BYTES - MAXRATE x KT  USB—BYTES = min (QTY—BYTES-MAXRATE x KT
x total— frame—number) . · · ( \ ) で与えられる。 ここで、  x total— frame—number). · · (\). here,
N T S C方式の場合には、 KT = 1/8 (bits) /30 (Hz) ,  KT = 1/8 (bits) / 30 (Hz),
PA L方式の場合には、 1/8 (bits) /25 (Hz)  1/8 (bits) / 25 (Hz) for PAL system
である。 また、 「totaし frame_number」 はエンコードされる素材の フレーム総数, min (s,t) は sまたは tの小さい方を選択する関数 である。 また、 ""DIFFICULTY— SUM」 は、 全てのピクチャの符号化難 易度の総和である。 It is. “Tota frame_number” is the total number of frames of the material to be encoded, and min (s, t) is a function that selects the smaller of s or t. It is. "" DIFFICULTY-SUM "is the sum of the encoding difficulty of all pictures.
SUPPLY— BYTES = USB_BYTES - TOTAL— HEADER . . . ( 2 ) DIFFICULTY— SUM = ∑ difficulty · . · ( 3 ) SUPPLY— BYTES = USB_BYTES-TOTAL— HEADER... (2) DIFFICULTY— SUM = ∑ difficulty ·. · (3)
B 二 GOP_MINBYTES · · · ( 4 )B two GOP_MINBYTES (4)
∑y = A x ∑x + Bx n ∑y = A x ∑x + Bx n
ここで、 ∑y = SUPPLY_BYTES, ∑ x = DIFFICULTY一 SUM, nは GO Pの総数である。 よって  Here, ∑y = SUPPLY_BYTES, ∑x = DIFFICULTY-one SUM, n is the total number of GOPs. Therefore
A (SUPPLY一 BYTES - Bxn) / DIFFICULTY— SIM  A (SUPPLY-BYTES-Bxn) / DIFFICULTY—SIM
となる。 従って、 各ピクチャのターゲッ ト量は、 Becomes Therefore, the target amount of each picture is
gop— target 二 A x gop_diff + B · · · ( 5 ) で与えられる。  gop—target 2 A x gop_diff + B · · · · (5)
その後、 各 GO P内で各ピクチャの符号化難易度に応じたビッ ト 配分が行われる。 G 0 P内での各ビクチャの配分は符号化難易度の 大きさに比例させた場合には、 各ピクチャの夕ーゲッ ト量は以下の 式で求められる。  After that, in each GOP, bits are allocated according to the coding difficulty of each picture. When the distribution of each of the pictures in G 0 P is proportional to the magnitude of the encoding difficulty, the evening target amount of each picture is obtained by the following equation.
target (k) = GOP— TARGET x diffuculty (k) / G0P_diff  target (k) = GOP— TARGET x diffuculty (k) / G0P_diff
• · · ( 6 ) • · · (6)
( 1≤k≤GO P内のピクチャ数) (Number of pictures in 1≤k≤GO P)
そして、 このようなビッ ト配分計算の後、 エンコード結果のビッ トス ト リームが書き込まれる R A I D 4のア ドレスが設定され、 ェ ンコーダ用コン トロールフアイルが出力される。 このようにして作 成されたコン トロールファイルによってエンコード処理を行うこと により、 素材の画像の難しさに応じた可変ビッ トレ一トェンコ一デ ィ ングが実行される。 以上が 2パス可変ビヅ トレ一トェンコ一ディ ングの概要である。 次に、 映画 (フィルム) 素材のプルダウン (pulldown) 処理につ いて説明する。 Then, after such a bit allocation calculation, a RAID 4 address to which the encoded bit stream is written is set, and an encoder control file is output. By performing the encoding process using the control file created in this way, variable bit-rate encoding according to the difficulty of the material image is executed. The above is an outline of the two-path variable bite-coding. Next, the pulldown processing of movie (film) material will be described.
24コマ/秒で構成されている映画フイルムを、 3 0フレーム/ 秒で構成される N T S C方式のテレビ ' ビデオ信号に変換するため に、 同じフィールド画像を周期的に繰り返す処理が行われる。 以下 では、 この処理を 2— 3プルダゥン変換という。  In order to convert a movie film composed of 24 frames / sec into an NTSC video signal composed of 30 frames / sec, a process of periodically repeating the same field image is performed. In the following, this process is called 2-3 pulldown conversion.
図 7は、 この 2— 3プルダウン変換の原理を示している。  Figure 7 illustrates the principle of this 2-3 pulldown conversion.
プルダウンのパターンの位相は、 フィルム素材から N T S C方式 のビデオ素材への変換時に決定される。 多くの場合はパターンが規 則的に変換されている。  The phase of the pull-down pattern is determined when converting film material to NTSC video material. In many cases, patterns are converted regularly.
ビデオ素材の 1フレームは 2フィ一ルドで構成されるが、 そのう ちの第 1フィールド (1st field ) を ト ップフィ一ルド (top_fiel d ) とし、 第 2フィ一ルド (2nd field ) をボトムフィ一ルド (bo ttom— field) とする。 また、 同じフィール ド画を繰り返す場所をリ ピー ト ファース トフィ 一ル ド (repeat— first— field) と呼ぶ。  One frame of video material is composed of two fields, of which the first field (1st field) is the top field (top_field) and the second field (2nd field) is the bottom field. (Bottom—field). A place where the same field image is repeated is called a repeat-first-field.
このような映画素材では、 同じフィ一ルドが繰り返される位置が 分かっていれば、 エンコードの際にそのフィールドを符号化しない ように処理して圧縮効率を高めることができる。  In such movie material, if the position where the same field is repeated is known, the encoding efficiency can be improved by processing the field so as not to be encoded.
符号化の際の 2— 3プルダウンパターンの組合せは、 以下の 4通 りである。  The following four combinations of 2-3 pull-down patterns are used for encoding.
0: bottom— iield—iirst  0: bottom— iield—iirst
1: bottom— field— nrst, repeat— first— field  1: bottom— field— nrst, repeat— first— field
2: top— field— first  2: top—field—first
3: top field— first, repeat— first— field ここでは、 これらのパターンの組合せを 「ピクチャモード」 と定 義する。 3: top field— first, repeat— first— field Here, the combination of these patterns is defined as “picture mode”.
プルダウン変換と同時に符号化を行う場合や、 上記プルダウンパ 夕一ンを示す情報等が与えられる場合には、 上述のようなプルダウ ン処理を考慮した最適の符号化、 すなわち繰り返されるフ ィ ール ド については画像の符号化を行わず、 どのフィ一ルドが繰り返された かを示す情報のみを出力するような符号化、 を行うことができるが、 これらの情報が与えられない場合には、 プルダウン処理を考慮した 符号化が適切に行えないことがある。  When encoding is performed at the same time as pull-down conversion, or when information indicating the pull-down pattern is given, optimal coding in consideration of the pull-down processing as described above, that is, repeated fields Can be used to output only information indicating which fields have been repeated without encoding the image, but if such information is not given, Encoding that takes into account pull-down processing may not be performed properly.
次に、 2— 3プルダウンパターンと、 N T S C方式に従う素材の ロールの先頭からのビデオフレーム番号 kとの関係について説明す る。  Next, the relationship between the 2-3 pull-down pattern and the video frame number k from the beginning of the roll of the material according to the NTSSC method will be described.
上述したピクチャモードを、 リピートされていない ト ップフィー ルドを含む位置とフレーム番号 kとの関係を p_mode[k]とすると、 図 7からも分かるように、 上記の 0〜 3のピクチャモードに属さな いフレーム番号が存在する。 この場合の p—mode[k] の値を 4とする。 図 2は、 プルダウンにおける p_mode[k] の状態遷移図である。 プルダウンが規則正しく連続している場合には、 p— mode[k] の値 は、 フレーム番号 kの増加に伴って、 5で割った余りの体 (mod 5 ) において 1ずつ増加していく。  Assuming that the relationship between the position including the unrepeated top field and the frame number k and the frame number k is p_mode [k], the picture mode described above does not belong to the picture modes 0 to 3 as shown in FIG. There is a new frame number. In this case, the value of p-mode [k] is 4. FIG. 2 is a state transition diagram of p_mode [k] in the pull-down. If the pulldowns are regular and continuous, the value of p—mode [k] will increase by one in the remainder modulo 5 (mod 5) with increasing frame number k.
P_mode[k+l] = (p_mode[k] + 1 ) mod 5 · · · ( 7 ) プルダウンパターンが乱れた場合には、 p_mode が 0または 2のと きのみ、 その値を繰り返すことができる。  P_mode [k + l] = (p_mode [k] + 1) mod 5 · · · (7) If the pull-down pattern is disturbed, the value can be repeated only when p_mode is 0 or 2.
p_mode[k+l] = (p_mode[k] + 1 ) mod 5 · · · ( 8 ) p_mode [k + l] = (p_mode [k] + 1) mod 5
(p_mode[k] が 0または 2の場合に限る) 2パスエンコーディ ングにおいては、 符号化難易度 (diff iculty) の測定を行う際にプルダウンパターンが自動検出される。 このとき、 測定されたプルダウンパターンをもとにビッ ト配分が行われ、 コン トロ一ルファイルが作成される。 (Only when p_mode [k] is 0 or 2) In two-pass encoding, a pull-down pattern is automatically detected when measuring the encoding difficulty (diff iculty). At this time, bits are allocated based on the measured pull-down pattern, and a control file is created.
そして、 最終的なエンコード時には、 上記のコン ト口一ルフアイ ルに記述されたプルダウンパターンに従って符号化が行われる。  Then, at the time of final encoding, encoding is performed according to the pull-down pattern described in the control file.
しかし、 上述したようなプルダウンパターンの自動検出手法は、 現在のフレームと 1つ前のフレームの、 トップフィ一ル ドおよびボ トムフィールドの差分をもとにしているという原理上、 素材が静止 画像に近い場合にはプルダウンパターンを正しく検出できないこと がある。  However, the automatic detection method of the pull-down pattern described above is based on the difference between the top field and the bottom field between the current frame and the previous frame, and the source is a still image. If it is close to, the pull-down pattern may not be detected correctly.
例えば、 映画の最初の部分について考えると、 最初のタイ トルシ —ンから始まる映像は黒からフヱ一ドィンし、 映画会社のロゴが現 れ、 黒にフヱードアウ トする。 このような場合には、 黒へのフエ一 ドィン /ァゥ トのような動きが少ない部分については、 プルダウン 位相の正確な検出が困難であり、 検出を誤ることが多い。  For example, considering the first part of a movie, the footage starting at the first title will be fed in from black, with the movie company logo appearing and fed out to black. In such a case, it is difficult to accurately detect the pull-down phase in a portion with little movement, such as a feed-in / art to black, and the detection is often erroneous.
さらに、 フィルム素材からビデオ素材に変換するコンバータに撮 像管を用いている古い装置が使用された素材では、 フ レーム間の残 像によってプルダゥン位相を正しく検出できない場合がある。  In addition, when using an old device that uses a picture tube as a converter for converting film material to video material, the pull-down phase may not be detected correctly due to the afterimage between frames.
同様の理由で、 前のフレームの画像と現在のフレームの画像とを 加算してランダムノイズを減らすようなノイズレデューサを用いた 素材でも、 プルダウン位相が正しく検出できない場合がある。  For the same reason, the pull-down phase may not be detected correctly even with a material using a noise reducer that reduces the random noise by adding the image of the previous frame and the image of the current frame.
また、 プルダウン位相が異なるフィルム素材を多数編集したよう な素材では、 編集ボイ ン 卜でプルダウンパターンの検出のディ レイ から、 誤ったプルダウン位相として検出されるおそれがある。 このように、 誤った位相でエンコードを行うと、 正しい位相に口 ックするまでの間は誤ったプルダウンパターンで処理されるため、 ェンコ一ド結果の画像の動きがぎこちなくなるなどの問題がある。 プルダウン処理によってエンコードを実行しても問題ないかどう かは、 素材のプルダウンパターンの安定性に大きく依存する。 In addition, in a material in which a large number of film materials having different pull-down phases are edited, there is a possibility that an erroneous pull-down phase is detected from a delay in detecting a pull-down pattern at an editing point. In this way, if encoding is performed with the wrong phase, it will be processed with the wrong pull-down pattern until it locks to the correct phase, causing problems such as awkward movement of the image as a result of encoding. . Whether there is no problem in performing encoding by pull-down processing largely depends on the stability of the pull-down pattern of the material.
しかし、 事前にその判定を行うことは困難であるため、 ォペレ一 夕が、 ェンコ一ド後の画像の動きを見て適性を判断するしかなく、 ェンコ一ド条件が不適切であつたと判断された場合には、 条件を変 えて最初からェンコ一ドし直さなければならないことが問題となつ ていた。 発 明 の 開 示 本発明は、 上述した問題点に鑑みてなされたものであり、 2パス 可変レートエンコードにおいて、 プルダウン処理によるェンコ一ド 条件の適否を、 ェンコ一ドの実行前に判定できるような画像符号化 方法及び装置を提供することを目的とする。  However, since it is difficult to make the determination in advance, the operation was forced to judge the suitability by looking at the movement of the image after the encodation, and it was judged that the encodation condition was inappropriate. In such a case, the problem was that the conditions had to be changed and the encoder re-written from the beginning. DISCLOSURE OF THE INVENTION The present invention has been made in view of the above-described problems, and has been made in consideration of the above-described problem. In two-pass variable rate encoding, it is possible to determine whether or not an encoding condition by pull-down processing is appropriate before executing the encoding. It is an object of the present invention to provide a simple image encoding method and apparatus.
上記の課題を解決するために、 本発明の画像符号化方法は、 プル ダウン変換が施された入力ビデオ素材に対してプルダウンパターン に基づく符号化を施す 2パス画像符号化方法において、 上記入力ビ デォ素材のプルダウンパターンを測定する測定工程と、 上記測定さ れたプルダウンパターンの安定度を判定する判定工程とを有するこ とを特徴とする。  In order to solve the above-mentioned problem, an image encoding method according to the present invention is directed to a two-pass image encoding method for performing encoding based on a pull-down pattern on an input video material subjected to pull-down conversion, It has a measuring step of measuring a pull-down pattern of a video material and a determining step of judging the stability of the measured pull-down pattern.
ここで、 上記判定工程は、 上記測定されたプルダウンパターンと 想定される複数の初期位相に基づく各プルダウンパターンとを比較 して、 上記各プルダウンパ夕一ンのうちの上記測定されたプルダウ ンパターンに最も近いプルダウンパターンを与える初期位相を選択 する選択工程と、 上記選択された初期位相に基づくプルダウンパ夕 ーンの、 上記ビデオ素材の総フレーム数に対する誤差を算出する誤 差算出工程と、 上記算出された誤差に基づいて、 上記選択された初 期位相に基づく プルダウンパターンの安定度をェンコ一ド前に判定 する安定度判定工程とを有することが好ましい。 Here, in the determination step, the measured pull-down pattern is compared with the pull-down patterns based on a plurality of assumed initial phases. And selecting an initial phase that gives a pull-down pattern closest to the measured pull-down pattern in each of the pull-down patterns, and selecting a pull-down pattern based on the selected initial phase. An error calculating step of calculating an error with respect to the total number of frames of the video material; and determining the stability of the pull-down pattern based on the selected initial phase before the encoding based on the calculated error. It is preferable to have a stability determination step.
また、 上記の課題を解決するために、 本発明の画像符号化装置は、 プルダウン変換が施された入力ビデオ素材に対してプルダウン処理 を施しながら、 プルダウンパターンに基づく符号化を施す 2パス画 像符号化装置において、 上記入力ビデオ素材のプルダウンパターン を測定する測定手段と、 上記測定されたプルダウンパターンと想定 される複数の初期位相に基づく各プルダウンパターンとを比較して、 上記各プルダウンパターンのうちの上記測定されたプルダウンパ夕 ーンに最も近いプルダウンパターンを与える初期位相を選択する選 択手段と、 上記選択された初期位相に基づく プルダウンパターンの、 上記ビデオ素材の総フレーム数に対する誤差を算出する誤差算出手 段と、 上記算出された誤差に基づいて、 上記選択された初期位相に 基づくプルダウンパターンの安定度をェンコ一ド前に判定する安定 度判定手段とを有することを特徴とする。  Further, in order to solve the above problem, an image encoding apparatus according to the present invention provides a two-pass image in which encoding based on a pull-down pattern is performed while performing pull-down processing on an input video material subjected to pull-down conversion. In the encoding device, a measuring means for measuring the pull-down pattern of the input video material is compared with the measured pull-down pattern and each of the pull-down patterns based on a plurality of assumed initial phases. Selecting means for selecting an initial phase that gives a pull-down pattern closest to the measured pull-down pattern, and calculating an error of the pull-down pattern based on the selected initial phase with respect to the total number of frames of the video material. The selected error is calculated based on the calculated error and the calculated error. And having a stability judging means for judging the stability of pull-down patterns based on the period phase Enko one de ago.
上記の本発明によれば、 2パス可変レートエンコードにおいて、 入力ビデオ素材のプルダウンパターンを測定し、 測定されたブルダ ゥンパターンの安定度により、 プルダウン処理によるエンコード条 件の適否を、 ェンコ一ドの実行前に判定できるようになる。 図面の簡単な説明 図 1は、 従来のビデオェンコ一ドシステムの構成例を示す図であ る。 According to the present invention described above, in two-pass variable rate encoding, the pull-down pattern of the input video material is measured, and the appropriateness of the encoding conditions by the pull-down processing is determined based on the stability of the measured Burden pattern. Can be determined before. BRIEF DESCRIPTION OF THE DRAWINGS FIG. 1 is a diagram showing a configuration example of a conventional video encoding system.
図 2は、 G 0 P構造について説明するための図である。  FIG. 2 is a diagram for explaining the G 0 P structure.
図 3は、 従来のビデオエンコードシステムにおける 2パスェンコ 一ドの基本的な処理手順を示すフ口一チャートである。  FIG. 3 is a flowchart showing a basic processing procedure of a two-pass code in a conventional video encoding system.
図 4 A〜図 4 Gは、 ビッ ト配分計算における余り ビッ 卜の処理例 を説明するための図である。  FIGS. 4A to 4G are diagrams for explaining examples of processing of surplus bits in the bit allocation calculation.
図 5は、 ビッ ト配分計算処理の手順の一具体例を示すフローチヤ ートである。  FIG. 5 is a flowchart showing a specific example of the procedure of the bit allocation calculation process.
図 6は、 G O Pごとの符号化難易度の和 「gop— diffj とェンコ一 ド時の G O P単位のビッ ト割当て量 「gop_target」 とを変換するた めの関数の一例を示す図である。  FIG. 6 is a diagram showing an example of a function for converting the sum of the encoding difficulty levels for each GOP “gop-diffj” and the bit allocation amount “gop_target” per GOP at the time of encoding.
図 7は、 2 _ 3プルダウン変換について説明するための図である。 図 8は、 プルダウンにおける p— mode [k] の状態遷移図である。 図 9は、 2— 3プルダゥンパターンの初期位相を示す図である。 図 1 0は、 測定されたプルダウンパターンと想定されるプルダゥ ンパターンとの比較結果の一例を示す図である。  FIG. 7 is a diagram for explaining 2 − 3 pull-down conversion. Fig. 8 is a state transition diagram of p-mode [k] in the pull-down. FIG. 9 is a diagram showing an initial phase of a 2-3 pull-down pattern. FIG. 10 is a diagram showing an example of a comparison result between the measured pull-down pattern and the assumed pull-down pattern.
図 1 1は、 プルダウンパターンの安定度を判断するアルゴリズム の一例を示すフローチャートである。  FIG. 11 is a flowchart illustrating an example of an algorithm for determining the stability of the pull-down pattern.
図 1 2は、 プルダウンパターンの安定度を判断するァルゴリズム の一例を示す、 図 1 1に続く フローチャートである。  FIG. 12 is a flowchart showing an example of an algorithm for judging the stability of a pull-down pattern, which is subsequent to FIG. 11.
図 1 3は、 本発明に係るビデオェンコ一ドの基本的な処理手順を 示すフローチャートである。 図 1 4は、 本発明に係るビデオェンコ一ドシステムの構成例を示 す図である。 発明を実施するための最良の形態 本発明の好ましい実施の形態について、 図面を参照しながら以下 説明する。 FIG. 13 is a flowchart showing a basic processing procedure of the video encoder according to the present invention. FIG. 14 is a diagram showing a configuration example of a video encoding system according to the present invention. BEST MODE FOR CARRYING OUT THE INVENTION Preferred embodiments of the present invention will be described below with reference to the drawings.
本発明の実施の形態においては、 入力ビデオ素材に対してブルダ ゥン処理に応じた符号化を施す 2パス方式の画像符号化の際に、 入 力ビデオ素材のプルダウンパターンを測定し、 測定されたプルダゥ ンパターンの安定度を判定している。 この安定度の判定は、 上記測 定されたプルダウンパターンと想定される複数の初期位相に基づく 各プルダウンパターンとを比較して、 各プルダウンパターンのうち の上記測定されたプルダウンパターンに最も近いプルダウンパ夕一 ンを与える初期位相を選択し、 選択された初期位相に基づくブルダ ゥンパターンの、 上記ビデオ素材の総フレーム数に対する誤差を算 出し、 算出された誤差に基づいて、 上記選択された初期位相に基づ くプルダウンパターンの安定度をェンコ一ド前に判定することで実 現している。 この判定結果に基づいて、 上記入力ビデオ素材のプル ダウン処理によるエンコードの適否を判断する。 なお、 上記ブルダ ゥン処理に応じた符号化あるいはプルダウン処理による符号化とは、 主としてプルダウンパターンの繰り返しフィールドを符号化しない ことにより符号化効率を高めるものである。  In the embodiment of the present invention, the pull-down pattern of the input video material is measured and measured during the two-pass image coding in which the input video material is coded according to the Blu-ray processing. The stability of the pull-down pattern is determined. The stability is determined by comparing the measured pull-down pattern with the pull-down patterns based on a plurality of assumed initial phases, and determining the pull-down pattern closest to the measured pull-down pattern among the pull-down patterns. Select the initial phase that gives the sunset, calculate the error of the bladder pattern based on the selected initial phase with respect to the total number of frames of the video material, and calculate the error based on the calculated error. This is achieved by judging the stability of the pull-down pattern based on the value before encoding. Based on this determination result, it is determined whether the input video material is suitable for encoding by pull-down processing. Note that the encoding according to the above-mentioned bundling process or the encoding by the pull-down process is to increase the encoding efficiency mainly by not encoding the repeated field of the pull-down pattern.
以下、 本発明に係る画像符号化方法及び画像符号化装置の実施の 形態について、 前述した 2— 3プルダウン変換が施されるビデオ素 材のエンコード処理を例として説明する。 Hereinafter, an embodiment of an image encoding method and an image encoding apparatus according to the present invention will be described with reference to a video element to which the above-described 2-3 pull-down conversion is performed. A description will be given of an example of material encoding processing.
図 9は、 前述した 2— 3プルダウンパターンの初期位相を示して いる。  FIG. 9 shows the initial phase of the 2-3 pull-down pattern described above.
フィルム素材からビデオ信号にフレーム変換する際の 2— 3プル ダウンは、 ほとんどの場合に規則正しく行われている。 そこで、 ェ ンコ一ドされる素材のプルダウンパターンは規則正しいとする。 また、 エンコードされる素材の最初はチャプター指定され、 必ず P_mode が 2の状態でェンコ一ドされなければならないと規定され ていることを考慮すると、 プルダウンパターンの初期位相は、 乱れ がない場合には、 この図に示す 7通りのいずれかのパターンで表す ことができる。  The 2-3 pull down when converting frames from film material to video signals is almost always regular. Therefore, it is assumed that the pull-down pattern of the encoded material is regular. Also, considering that the beginning of the encoded material is specified as a chapter and that the encoding must always be performed with P_mode set to 2, the initial phase of the pull-down pattern will be It can be represented by any of the seven patterns shown in this figure.
これらのプルダウンのプルダゥンパターンは、 初期位相のモード を p— start ( 0≤ p— start ≤ 6 ) とすると、 k番目のフレームの ピクチャモード p— mode[k]は、 以下の式で表される。  The pull-down patterns of these pull-downs are as follows. If the mode of the initial phase is p-start (0≤p-start≤6), the picture mode p-mode [k] of the k-th frame is expressed by the following equation. You.
pd_cycle[7][10] = {{2,2,2,2,2,2,2,2,2,2},  pd_cycle [7] [10] = {{2,2,2,2,2,2,2,2,2,2},
{2, 3, 4, 0,0,0, 0,0, 0,0},  {2, 3, 4, 0,0, 0, 0,0, 0,0},
{2,3,4,0,1,2,3,4,0,1},  {2,3,4,0,1,2,3,4,0,1},
{2,2,3,4,0,1,2,3,4,0},  {2,2,3,4,0,1,2,3,4,0},
{2,2,2,3,4,0,1,2,3,4},  {2,2,2,3,4,0,1,2,3,4},
{2,2,2,2,3,4,0,1,2,3},  {2,2,2,2,3,4,0,1,2,3},
{2,2,2,2,2,3,4,0,1,2}}  {2,2,2,2,2,3,4,0,1,2}}
p_mode[kj = pd— cycle [pd— start] [k mod 5] ( k < 5 のとき)  p_mode [kj = pd— cycle [pd— start] [k mod 5] (when k <5)
p_mode[k] = pd—cycle[pd— start] [k mod 5 + 5] ( k≥ 5 のとき) そこで、 本発明の実施の形態の画像符号化方法では、 フレーム番 号 k ( 0≤ k≤kend) に対して想定される上記の 7通りの初期位相 に基づく プルダウンパターンと、 測定されたプルダウンパターンと を比較し、 その 7通りのうちの最もエラーが少ないものを選択する。 以下に、 このような本発明に係る画像符号化方法の実施の一形態 としてのビデオェンコ一ド処理の流れを説明する。 p_mode [k] = pd—cycle [pd— start] [k mod 5 + 5] (when k≥5) Therefore, in the image coding method according to the embodiment of the present invention, a pull-down pattern based on the above seven initial phases assumed for a frame number k (0≤k≤kend) and a measured pull-down pattern Compare with and select the one with the least error out of the seven. Hereinafter, a flow of the video encoding process as an embodiment of the image encoding method according to the present invention will be described.
( 1 ) まず、 ps番目のプルダウンパターンと測定されたプルダゥ ンパターンとを比較して、 一致していたら pd_match[ps] を 1だけ 増加する。 一方、 比較結果が違っていたら、 位相がずれはじめたポ イン 卜の個数 (エラ一の立ち上がりエッジ) を pd— errnb[ps] とし てカウン トする。  (1) First, the ps-th pull-down pattern is compared with the measured pull-down pattern, and if they match, pd_match [ps] is increased by one. On the other hand, if the comparison results are different, the number of points at which the phase has started to shift (rising edge of the error) is counted as pd-errnb [ps].
( 2 ) 上記 ( 1 ) の処理を 0≤ k^kend の範囲で繰り返す。 (2) Repeat the above process (1) in the range of 0≤k ^ kend.
( 3 ) 上記 ( 1 ) および ( 2 ) の処理を 0≤ps≤ 6 の範囲で繰 り返す。 (3) The above processes (1) and (2) are repeated within the range of 0≤ps≤6.
( 4 ) 0≤ps≤ 6 の範囲での pd_match[ps] の最大値を求める。 最大となった ps についての位相がずれはじめたポイン トの個数 pd_errnb[ps] を pd— error— max とする。  (4) Find the maximum value of pd_match [ps] in the range 0≤ps≤6. Let pd_errnb [ps] be the number of points at which the phase has started to shift for the maximum ps, pd_error–max.
( 5 ) 測定された総フレーム数 frame_nbに対するパターンマッチ ング率 pd一 match— ratio と、 エラー発生率 pd_error— ratio を、 以 下のように求める。  (5) The pattern matching rate pd-match-ratio and the error occurrence rate pd_error-ratio for the measured total number of frames frame_nb are calculated as follows.
pd— error— ratio = pd— error— max / f rame_nb * 100 (¾) pd— match— ratio = pd— match— max / frame— nb * 100 (%) pd— error— ratio = pd— error— max / f rame_nb * 100 (¾) pd— match— ratio = pd— match— max / frame— nb * 100 (%)
( 6 ) パターンマッチング率 pd_match— ratio がしきい値 PD— MATC H— LIMIT 以下である場合、 または、 総フレーム数 frame— nb が、 しき い値 PD FRAME LIMIT 以上で、 かつ、 エラ一発生率 pd error ratio がしきい値 PD— ERROR_LIMIT 以上である場合に、 エンコード素材のプ ルダウンパターンは安定していない (従って、 プルダウン処理を指 定してェンコ一ドすると画質に問題が生じる可能性が大きい) と判 定して、 ォペレ一夕に警告を示すメ ッセージを表示する。 (6) If the pattern matching rate pd_match— ratio is less than or equal to the threshold value PD— MATC H— LIMIT, or if the total number of frames frame— nb is greater than or equal to the threshold value PD FRAME LIMIT, and the error occurrence rate pd error ratio Is greater than or equal to the threshold value PD—ERROR_LIMIT, it is determined that the pull-down pattern of the encoded material is not stable (there is a high possibility that there will be a problem with the image quality if encoding is performed by specifying the pull-down processing). A warning message will be displayed immediately after the operation.
( 7 ) オペレータ一が、 上記の警告を見て、 当初のエンコード条 件で処理を続けるかどうかを判断する。 処理を中止する場合には、 ェンコ一ド条件からプルダウン処理の指定をはずして、 エンコード 作業を最初からやり直す。  (7) The operator sees the above warning and determines whether or not to continue processing under the original encoding conditions. To stop the processing, remove the pull-down processing from the encoding conditions and restart the encoding work from the beginning.
上記のような手順により行われる、 本発明に係る実施の形態のビ デォエンコードにおいて、 エンコード素材のプルダウンパターンの 安定度を判定するためのしきい値は、 例えば以下のように設定され る。  In the video encoding according to the embodiment of the present invention performed by the above-described procedure, the threshold value for determining the stability of the pull-down pattern of the encoded material is set as follows, for example.
PD— MATCH一 LIMIT = 75 (%)  PD—MATCH-LIMIT = 75 (%)
PD_ERROR_LIMIT = 0.5 (%)  PD_ERROR_LIMIT = 0.5 (%)
PD_FRAME_LIMIT = 10000 (frame)  PD_FRAME_LIMIT = 10000 (frame)
また、 初期値は、 次のように設定される。  The initial value is set as follows.
pd_match[ps] = 0; ( p— mode が同じであった回数 ) pd_errnb[ps] 二 0; ( pd—mode が変ィ匕した回数 ) pd_match [ps] = 0; (number of times p—mode was the same) pd_errnb [ps] 2 0; (number of times pd—mode changed)
(0 ≤ ps ≤ 6) (0 ≤ ps ≤ 6)
pd— error = pd_error_back : 0;  pd—error = pd_error_back: 0;
pd— match— max = 0  pd—match—max = 0
次に、 プルダウンパターンの測定について説明する。  Next, the measurement of the pull-down pattern will be described.
図 1 0は、 本実施の形態における、 仮エンコード時に測定される、 ェンコ一ド素材のプルダウンパターンを、 前述した 7通りの初期位 相に基づくプルダウンパターンと比較した結果の一例を示している。 この図において、 error は、 測定結果とプルダウンパターンが異 なっている場合に 1 とされる。 pd_match [ps ] は、 error が 0の個 数、 すなわち p_mode が同じであった回数を示す。 また、 pd— error [ps ] は、 error が 0から 1になるところのエッジの数と同じであ る。 FIG. 10 shows an example of a result of comparing a pull-down pattern of an encoder material, which is measured at the time of provisional encoding, with a pull-down pattern based on the above-mentioned seven initial phases in the present embodiment. In this figure, error is set to 1 when the measurement result and the pull-down pattern are different. pd_match [ps] indicates the number of error is 0, that is, the number of times p_mode is the same. Also, pd—error [ps] is equal to the number of edges where error goes from 0 to 1.
この例では、 P S = 2で示される初期位相に基づくプルダウンパ 夕一ンが、 測定されたプルダウンパターンに最も近いことが分かる。 ここでは、 total— frame = 1 3なので、  In this example, it can be seen that the pull-down pattern based on the initial phase represented by P S = 2 is closest to the measured pull-down pattern. Here, total— frame = 1 3
パターンマッチング率 pdjnatch— ratio = 84. 5 %  Pattern matching ratio pdjnatch— ratio = 84.5%
エラー発生率 pd— error— rat io 二 7. 7% となる。  Error rate pd—error—rat io 2 7.7%.
この結果を、 前述の設定されたしきい値を用いて判定すると、 こ の測定された素材のプルダウンパターンは安定していると判断され る。 このように、 プルダウンパターンの測定値に対する pd— match の値が最大のものが、 初期位相として選択される。  When this result is determined using the threshold value set above, it is determined that the measured pull-down pattern of the material is stable. Thus, the one with the largest value of pd-match for the measured value of the pull-down pattern is selected as the initial phase.
図 1 1および図 1 2は、 上述した本発明の実施の一形態としての ビデオェンコ一ド処理における、 プルダウンパターンの安定度を判 断するァルゴリズムの一具体例を示している。  FIGS. 11 and 12 show a specific example of an algorithm for judging the stability of a pull-down pattern in the video encoding processing as an embodiment of the present invention described above.
図 1 1のステップ S 1では、 pjnode が同じであった回数 pd— mat ch [ps ]および pd— error [ps ]が初期化されて、 いずれも値が 0にさ れる。 ただし、 psで示されるプルダウンパターンの初期位相は、 前 述したように 7通りに限られることから、 0≤ps≤ 6である。 また、 pd— error , pd_error_Dac , pd— match— max , psの ί直が、 レヽ れも 0 (こ される。  In step S1 of FIG. 11, the number of times pjnode is the same is initialized, pd—match [ps] and pd—error [ps] are initialized to zero. However, the initial phase of the pull-down pattern represented by ps is 0≤ps≤6 because the initial phase is limited to seven as described above. In addition, the values of pd—error, pd_error_Dac, pd—match—max, and ps are updated to 0 (this is also done).
次に、 ステップ S 2では、 ビデオのフレーム番号 kの値が 0にさ れる。 Next, in step S2, the value of the video frame number k is set to 0. It is.
次に、 ステップ S 3では、 k < 5であるかどうかが判断される。 k < 5であればステップ S 4に進む。 一方、 k < 5を満たさないと きはステップ S 5に進む。 これは、 図 9に示すプルダウンパターン の初期位相において、 最初の 4フレームまでが特異点となるためで ある。  Next, in step S3, it is determined whether k <5. If k <5, go to step S4. On the other hand, when k <5 is not satisfied, the process proceeds to step S5. This is because in the initial phase of the pull-down pattern shown in FIG. 9, up to the first four frames are singularities.
そして、 ステップ S 4では pm = pd— cyc le [st] [k mod 5 ] とされ、 ステップ S 5では pm = pd_cyc le [ st] [k mod 5+5] とされる。  Then, in step S4, pm = pd−cyc le [st] [k mod 5], and in step S5, pm = pd_cyc le [st] [k mod 5 + 5].
次に、 ステップ S 6で pd— error一 back = pd— error とされる。 そして、 ステップ S 7では、 pm == p mode [k] であるかどうかが 判断され、 この条件を満たす場合にはステップ S 8に進み、 この条 件を満たさない場合にはステップ S 9に進む。 ここで、 「=」 は代 入を意味しているのに対し、 「==」 は C言語等で用いられるのと同 様に等しいかどうかの条件判定を意味するものである。  Next, in step S6, pd—error—back = pd—error. Then, in step S7, it is determined whether pm == p mode [k]. If this condition is satisfied, the process proceeds to step S8, and if not, the process proceeds to step S9. . Here, “=” means substitution, while “==” means condition determination as to whether or not they are the same as in C language.
次に、 ステップ S 8では、 pd—match [ps ]の値が 1だけイ ンク リメ ン トされ、 また pd_error の値が 0にされる。  Next, in step S8, the value of pd-match [ps] is incremented by 1 and the value of pd_error is set to 0.
一方、 ステップ S 9では、 pd_error の値が 1にされる。  On the other hand, in step S9, the value of pd_error is set to 1.
そして、 ステップ S 1 0では、 pd error == 1 かつ pd error ba ck == 0 であるかどうかが判断される。 この条件を満たす場合には ステップ S 1 1 に進み、 pd errnb [ps]の値が 1だけインク リメン ト される。 一方、 ステップ S 1 0の条件を満たさない場合にはステツ プ S 1 1をスキップしてステップ S 1 2に進む。  Then, in step S10, it is determined whether or not pd error == 1 and pd error back == 0. If this condition is satisfied, the process proceeds to step S11, and the value of p derrnb [ps] is incremented by one. On the other hand, if the condition of step S10 is not satisfied, the process skips step S11 and proceeds to step S12.
次に、 ステップ S 1 2で、 フレーム番号 kが 1だけインク リメン 卜される。  Next, in step S12, the frame number k is incremented by one.
ステップ S 1 3では、 フレーム番号 kが kendを越えたかどうかが 判断され、 この条件を満たさない場合、 すなわち最後のフレームま で至っていない場合にはステツプ S 3に戻って上記の手順が繰り返 される。 一方、 この条件を満たす場合、 すなわち最後のフレームま で至った場合にはステップ S 1 4に進み、 psの値が 1だけインク リ メン トされて、 次の初期位相に基づくプルダウンパターンについて 同様の処理が行われる。 In step S13, it is determined whether the frame number k has exceeded kend. If it is determined that this condition is not satisfied, that is, if the last frame has not been reached, the process returns to step S3 and the above procedure is repeated. On the other hand, if this condition is satisfied, that is, if the last frame has been reached, the process proceeds to step S14, in which the value of ps is incremented by 1 and the same applies to the pull-down pattern based on the next initial phase. Processing is performed.
ステップ S 1 5では、 ps > 6であるかどうかが判断され、 この条 件を満たさない場合、 すなわち前述の 7通りの初期位相に基づく プ ルダウンパターンの全てについての処理が終了していない場合には ステップ S 2に戻って上記の手順が繰り返される。 一方、 この条件 を満たす場合、 すなわち前述の 7通りの初期位相に基づく プルダウ ンパターンの全てについて処理が終了した場合には図 1 2のステヅ プ S 1 6に進み、 ps二 0とされる。  In step S15, it is determined whether or not ps> 6, and if this condition is not satisfied, that is, if the processing for all the pull-down patterns based on the seven initial phases described above has not been completed, Returns to step S2 and repeats the above procedure. On the other hand, if this condition is satisfied, that is, if the processing has been completed for all of the above seven pull-down patterns based on the initial phase, the process proceeds to step S16 in FIG. 12 and is set to ps20.
ステップ S 1 7では、 pd— match— max が、 pd_match[ps ] よりも小 であるかどうかが判断され、 この条件を満たす場合には、 ステップ S 1 8に進み、 pd_match_max = pd_match[ps] , pd_error_max = pd— errnb [ps]とされる。 一方、 ステップ S 1 7の条件を満たさない 場合には、 ステップ S 1 8をスキップしてステップ S 1 9に進む。 ステップ S 1 9では、 psの値が 1だけィンクリメン トされて、 次 の初期位相に基づくプルダウンパ夕一ンについて同様の処理が行わ れる。  In step S17, it is determined whether pd—match—max is smaller than pd_match [ps]. If this condition is satisfied, the process proceeds to step S18, where pd_match_max = pd_match [ps], pd_error_max = pd—errnb [ps]. On the other hand, if the condition of step S17 is not satisfied, step S18 is skipped and the process proceeds to step S19. In step S19, the value of ps is incremented by 1 and the same processing is performed for the next pull-down pattern based on the initial phase.
ステップ S 2 0では、 ps > 6であるかどうか、 すなわち前述の 7 通りの初期位相に基づくプルダウンパターンの全てについての処理 が終了したかどうかが判断され、 この条件を満たさない場合にはス テツプ S 1 7に戻って上記の手順が繰り返される。 一方、 この条件 を満たす場合にはステップ S 2 1に進み、 エラ一発生率 pd— error— ratio , ノ 夕一ンマッチング率 pd—match— rat io が計算される。 In step S20, it is determined whether or not ps> 6, that is, whether or not the processing for all of the above seven pull-down patterns based on the initial phase has been completed. Returning to S17, the above procedure is repeated. On the other hand, this condition If the condition is satisfied, the process proceeds to step S21, and the error occurrence rate pd—error—ratio and the non-uniform matching rate pd—match—rat io are calculated.
そして、 ステップ S 2 2では、 パターンマッチング率 pd— match_ ratio がしきい値 PD— MATCH— L IMITよりも小である、 または、 測定さ れた総フレーム数 frame_nb がしきい値 PD_FRAME— L IMIT およびエラ —発生率 dp_error_ratioがしきい値 PD— ERROR— R より大であるか どうかが判断される。 この条件を満たしている場合には、 測定され たプルダウンパターンが安定していないと判断されてステップ S 2 3で pd_stabl e= 0 とされる。 一方、 この条件を満たしている場合 には、 測定されたプルダウンパターンが安定していると判断されて ステップ S 2 4で pd_stabl e= 1 とされる。  In step S22, the pattern matching ratio pd—match_ratio is smaller than the threshold value PD—MATCH—L IMIT, or the total number of measured frames frame_nb is equal to the threshold value PD_FRAME—L IMIT and Error — Determines whether dp_error_ratio is greater than the threshold PD — ERROR — R. If this condition is satisfied, it is determined that the measured pull-down pattern is not stable, and pd_stabl e = 0 is set in step S23. On the other hand, if this condition is satisfied, it is determined that the measured pull-down pattern is stable, and pd_stable = 1 is set in step S24.
図 1 3は、 以上説明したプルダウンパターンの安定度の算出を含 む、 本発明に係るビデオェンコ一ドの基本的な処理手順を示してい る。  FIG. 13 shows a basic processing procedure of the video encoder according to the present invention, including the calculation of the stability of the pull-down pattern described above.
まず、 ステップ S 3 1でエンコード条件が入力され、 ステップ S 3 2で符号化難易度 (Diff i culty) パラメ一夕が入力され、 ステツ プ S 3 3でこれらに基づく仮エンコードによりプルダウン素材のプ ルダウン (pul ldown) パターンの安定度が算出される。  First, in step S31, encoding conditions are input, and in step S32, encoding difficulty (Diff i culty) parameters are input. In step S33, pull-down material processing is performed by provisional encoding based on these parameters. Pull down The stability of the pattern is calculated.
ステップ S 3 4で、 上記の算出されたプルダウンパターンの安定 度が判断され、 安定していないと判断された場合にはステツプ S 3 5でワーニング (警告) が表示され、 ステップ S 3 6でエンコード を続けるかどうかがオペレータにより判断される。 そして、 ステツ プ S 3 6で、 当初のェンコ一ド条件で処理を続けるとされた場合に はステツプ S 3 7に進む。 一方、 ステップ S 3 4で、 算出されたプ ルダウンパターンが安定していると判断された場合にはそのままス テツプ S 3 7に進む。 In step S34, the stability of the calculated pull-down pattern is determined. If it is determined that the pattern is not stable, a warning is displayed in step S35, and the encoding is performed in step S36. Is determined by the operator. If it is determined in step S36 that the processing is to be continued under the initial encoding conditions, the process proceeds to step S37. On the other hand, if it is determined in step S34 that the calculated pull-down pattern is stable, Proceed to step S37.
なお、 ステップ S 3 6でェンコ一ドを続けないとされた場合には、 ステップ S 4 4でプルダウン処理なしのエンコードを行う等してビ デォエンコード処理を終了する。  If it is determined in step S36 that encoding is not to be continued, the video encoding process is terminated by performing encoding without pull-down processing in step S44.
次に、 ステップ S 3 7では、 シーンチェンジの検出/処理が行わ れる。  Next, in step S37, detection / processing of a scene change is performed.
ステップ S 3 8では、 境界を Pピクチヤ, I ピクチャの並びに変 換するチヤプ夕 (CHAPTER) 境界処理が行われる。 ステップ S 3 9 では、 符号化難易度 (Difficulty) の補間/補正処理が行われる。 ステップ S 4 0では、 ターゲッ トビッ ト (Target bit) 数が計算さ れる。 ステップ S 4 1では、 アドレス (ADDRESS) が計算される。 ステップ S 4 2では、 tg— rate が算出される。  In step S38, a CHAPTER boundary process for converting the boundary into a sequence of P-pictures and I-pictures is performed. In step S39, interpolation / correction processing of encoding difficulty (Difficulty) is performed. In step S40, the number of target bits is calculated. In step S41, an address (ADDRESS) is calculated. In step S42, tg-rate is calculated.
なお、 ステップ S 3 7からステップ S 4 1 までの各ステップにお ける処理は、 図 5に示した従来の処理手順における処理と同様に行 うことができる。  The processing in each of the steps S37 to S41 can be performed in the same manner as the processing in the conventional processing procedure shown in FIG.
そして、 ステップ S 4 3で、 ェンコ一ダ用コン トロールファイル が作成されてビデオェンコ一ド処理が終了する。  Then, in step S43, a control file for the encoder is created, and the video encoder processing ends.
次に、 本発明に係る画像符号化装置について説明する。  Next, an image encoding device according to the present invention will be described.
図 1 4は、 本発明に係る画像符号化装置の実施の一形態としての ビデオェンコ一ドシステムの構成例を示している。  FIG. 14 shows a configuration example of a video encoding system as an embodiment of the image encoding device according to the present invention.
このビデオェンコ一ドシステムは、 上述した本発明に係る画像符 号化方法を適用して、 D V D ( Digital Versati le Disk, Digital Video Disk) 用にビデオ情報を圧縮符号化してォーサリングなどを 行うために用いることができるものであり、 その基本的な構成は図 1に示した従来のビデオェンコ一ドシステムの構成とほぼ同様とす ることができる。 This video encoding system is used for applying the image encoding method according to the present invention described above to compress and encode video information for DVD (Digital Versatile Disk, Digital Video Disk) and to perform authoring or the like. The basic configuration is almost the same as the configuration of the conventional video encoding system shown in FIG. Can be
主コン トローラ 1 1は、 このビデオエンコードシステムに割り当 てられた計算機により構成され、 ネッ トワーク 2を介して接続され るス一パーバイザ 3との間でデータ通信を行って、 このビデオェン コードシステム全体の動作を制御する。  The main controller 11 is composed of a computer assigned to the video encoding system, performs data communication with a supervisor 3 connected via a network 2, and controls the entire video encoding system. Control the operation of.
具体的には、 主コン トローラ 1 1は、 グラフィカルユーザ一ィン 夕一フエース (GU I : Graphical User Interface) 部 14の管理 により、 スーパ一バイザ 3からの制御を受け付けると共に、 図示し ていないオペレー夕の操作を受け付け、 この GU I部 14により管 理されるビッ トアサイ ン部 1 5 , エンコーダコン トロール部 16 , V T Rコン ト口一ル部 1 7により、 エンコーダ 1 2 , ビデオテープ レコーダ (VTR) 1 0の動作を制御する。 これにより、 主コン ト ローラ 1 1は、 スーパ一バイザ 3から通知されたェンコ一ド条件に 従って、 処理対象の素材を符号化処理し、 その処理結果をスーパ一 バイザ 3に通知する。 さらに、 主コン ト口一ラ 1 1は、 GU I部 1 4を介してオペレー夕の設定を受け付けて、 上記の符号化の詳細な 条件を変更できるようにされている。  More specifically, the main controller 11 receives control from the supervisor 3 under the control of a graphical user interface (GUI: Graphical User Interface) unit 14 and operates an unillustrated operator. The evening operation is accepted, and the bit assignment section 15, the encoder control section 16, and the VTR control section 17 managed by the GUI section 14 allow the encoder 12, video tape recorder (VTR) Control the operation of 10. Accordingly, the main controller 11 encodes the material to be processed in accordance with the encoding condition notified from the supervisor 3 and notifies the supervisor 3 of the processing result. Further, the main controller 11 can receive the setting of the operating system through the GUI unit 14 and change the above detailed conditions of the encoding.
具体的には、 主コン トローラ 1 1の G U I部 14は、 ビッ トアサ イン部 1 5のビッ ト配分プログラム 「BIT_ASSIGN」 , エンコーダコ ン ト口一ル部 1 6のエンコーダコン トロールプログラム 「CTRL_ENC」 および VTRコン トロール部 1 7の VTRコン トロ一ルプログラム の 3つのプログラムを管理している。  Specifically, the GUI section 14 of the main controller 11 includes a bit allocation program “BIT_ASSIGN” of the bit assignment section 15, an encoder control program “CTRL_ENC” of the encoder control port section 16, and The VTR control section 17 manages three VTR control programs.
また、 ビッ トアサイン部 1 5は、 スーパーバイザ 3から通知され る符号化ファイル 「v.enc」 に従って符号化処理の条件をフレーム 単位で決定し、 この条件による制御デ一夕をファイル形式 「CTL filej によりコン トロール部 1 6に通知する。 Further, the bit assigning unit 15 determines the conditions of the encoding process in units of frames according to the encoded file “v.enc” notified from the supervisor 3, and converts the control data based on these conditions into the file format “CTL. The control section 16 is notified by filej.
このとき、 ビッ トアサイン部 1 5は、 符号化処理におけるビッ ト 配分を設定し、 さらに設定された条件をオペレー夕の操作に応じて 変更する。 さらに、 ビッ トアサイン部 1 5は、 デ一夕圧縮されたビ デォデ一夕 D 2が、 エンコーダ 1 2から S C S I等を介して RA I D 4に記録されると、 R A I D 4上のア ドレスデ一夕 「v.adr」 を、 後段における多重化処理に必要なデータ量等の情報 「vxxx.aui」 と 共にスーパ一バイザ 3に通知する。  At this time, bit assignment section 15 sets the bit allocation in the encoding process, and changes the set conditions according to the operation of the operator. In addition, when the bit-decompressed video data D 2 is recorded in the RA ID 4 from the encoder 12 via SCSI or the like, the bit assignment section 15 reads the address data on the RAID 4. “v.adr” is notified to the supervisor 3 together with information “vxxx.aui” such as the data amount necessary for the multiplexing process in the subsequent stage.
エンコーダコン トロール部 1 6は、 ビッ トアサイン部 1 5から通 知される制御ファイル 「CTL file」 に従って、 ィ一サネッ ト ETHER などを介してエンコーダ 12の動作を制御する。 さらに、 ェンコ一 ダコン トロール部 1 6は、 符号化処理に要する符号化難易度 「dif- ficultyj のデ一夕をフレ一ム単位でビッ トアサイ ン部 1 5に通知 し、 ビデオデ一夕 D 2が記録された R A I D 4の記録ァドレスのデ —夕 「v.adr」 , 後の多重化処理に必要なデータ 「vxxx. aui 」 を ビッ トアサイン部 1 5に通知する。  The encoder control unit 16 controls the operation of the encoder 12 via the Ethernet ETHER or the like according to the control file “CTL file” notified from the bit assignment unit 15. Further, the encoder control unit 16 notifies the bit assignment unit 15 of the encoding difficulty level "dif-ficultyj" required for the encoding process to the bit assigning unit 15 in frame units, and the video decoding unit D2 Notify the bit assignment section 15 of the recorded address of the recorded RAID 4 address — “v.adr” and the data “vxxx. Aui” required for the subsequent multiplexing process.
V T Rコン トロール部 1 7は、 スーパーバイザ 3から通知される 編集リス トに従って、 R S— 422 ( 9ピンリモート) などを介し てビデオテープレコーダ (VTR) 1 0の動作を制御し、 所望の編 集対象の素材を再生する。  The VTR control section 17 controls the operation of the video tape recorder (VTR) 10 via an RS-422 (9-pin remote) or the like according to the edit list notified from the supervisor 3, and performs a desired editing target. Play the source material.
ビデオテープレコーダ (VTR) 1 0は、 主コン トローラ 1 1を 介してスーパ一バイザ 3から通知される編集リス 卜に従って、 磁気 テープに記録されたビデオデータ D 1を再生して、 処理対象の 「SDI」 , 「REF V」 , 「TIME CODEj をェンコ一ダ 1 2に出力する。 この VTR 1 0としては、 通常はディ ジ夕ル VTRが用いられる。 エンコーダ 1 2は、 スーパーバイザ 3から主コン トローラ 1 1 を 介して通知される条件に従って動作を切り換え、 V T R 1 0から出 力されるビデオデ一夕 D 1を、 M P E G (Moving P icture Experts Group) の手法により圧縮符号化する。 The video tape recorder (VTR) 10 reproduces the video data D1 recorded on the magnetic tape in accordance with the edit list notified from the supervisor 3 via the main controller 11, and outputs the video data D1 to be processed. SDI ”,“ REF V ”, and“ TIME CODEj ”are output to encoder 12. As VTR 10, usually a digital VTR is used. The encoder 12 switches its operation according to the conditions notified from the supervisor 3 via the main controller 11, and converts the video data D 1 output from the VTR 10 into the MPEG (Moving Picture Experts Group) method. Compression encoding.
このとき、 エンコーダ 1 2は、 符号化処理の結果を主コン トロー ラ 1 1に通知し、 主コン ト口一ラ 1 1は、 そのデ一夕圧縮における 符号化の条件を制御し、 発生するビッ ト量を制御する。 これにより、 主コン トローラ 1 1は、 デ一夕圧縮により発生するビッ ト量をフレ ーム単位で把握できる。  At this time, the encoder 12 notifies the main controller 11 of the result of the encoding process, and the main controller 11 controls the encoding condition in the overnight compression and generates Controls the amount of bits. As a result, the main controller 11 can grasp the bit amount generated by the overnight compression in frame units.
また、 エンコーダ 1 2は、 2パスエンコードにおける事前のェン コード条件設定の処理時 (仮ェンコ一ド時) には、 V T R 1 0から はビデオデ一夕を単にデ一夕圧縮して処理結果を主コン トロ一ラ 1 1に通知するだけであるが、 最終的なデ一夕圧縮処理時 (本ェンコ ード時) には、 圧縮処理されたビデオデータ D 2を R A I D 4に記 録し、 さらにそのデ一夕が記録されたアドレス, デ一夕量等を主コ ン トローラ 1 1に通知する。  Also, the encoder 12 simply compresses the video data from the VTR 10 at the time of processing of the pre-encode condition setting in the two-pass encoding (at the time of the provisional encoding), and processes the processing result. Only the main controller 11 is notified, but at the time of the final data compression processing (at the time of this encoding), the compressed video data D 2 is recorded in RAID 4, and Further, the main controller 11 is notified of the address at which the data was recorded, the data amount, and the like.
モニタ装置 1 3は、 エンコーダ 1 2によりデ一夕圧縮されたビデ ォデ一夕 D 2をモニタできるように構成される。 このモニタ装置 1 3ににより、 このビデオエンコードシステムでは、 ォペレ一夕がデ —夕圧縮処理の結果を必要に応じて確認する、 いわゆるプレビュー を行うことができる。 そして、 ォペレ一夕が、 このプレビュー結果 に基づいて主コン トローラ 1 1を操作して、 符号化の条件を詳細に 変更できるようにされている。  The monitor device 13 is configured to monitor the video data D2 compressed by the encoder 12 overnight. With this monitor device 13, in this video encoding system, a so-called preview can be performed, in which the operating system confirms the result of the data compression process as needed. The operator can operate the main controller 11 based on the preview result to change the encoding conditions in detail.
以上説明したような画像符号化方法および画像符号化装置によれ ば、 2パス可変レ一トェンコ一ドの条件としてプルダウン処理が指 定された場合に、 エンコード対象となる素材の適性を、 本ェンコ一 ドを実行する前に判断できるため、 D V Dのォ一サリングなどを行 う際に発生するェンコ一ド条件の見直しなどの作業工数を削減でき る。 すなわち、 2— 3プルダウンによる 2パス可変レートェンコ一 ドにおいて、 プリエンコード (仮エンコード) 時に、 素材の複雑さ を示す符号化難易度の測定と共に、 プルダウンパターンの安定度を 求めてェンコ一ド素材の適性を本ェンコ一ド前に判定するようにし たため、 早い時点でエンコード条件の見直しを促すことができるよ うになる。 According to the image coding method and the image coding apparatus as described above, the pull-down processing is specified as a condition of the two-pass variable rate code. If this is specified, the suitability of the material to be encoded can be determined before executing this encoding, so work such as reviewing the encoding conditions that occur when performing DVD authoring, etc. Man-hours can be reduced. In other words, in a two-pass variable rate encoder with 2-3 pull-down, at the time of pre-encoding (temporary encoding), along with measuring the encoding difficulty indicating the complexity of the material, the stability of the pull-down pattern is determined to determine the stability of the encoder material. Since the suitability is determined before this code, it is possible to promptly review the encoding conditions at an early stage.

Claims

請 求 の 範 囲 The scope of the claims
1 . 入力ビデオ素材に対してプルダウン処理に応じた符号化を施す1. Encode input video material according to pull-down processing
2パス方式の画像符号化方法において、 In a two-pass image encoding method,
上記入力ビデオ素材のプルダウンパターンを測定する測定工程と、 上記測定されたプルダウンパターンの安定度を判定する判定工程 と  A measuring step of measuring a pull-down pattern of the input video material; and a determining step of determining stability of the measured pull-down pattern.
を有することを特徴とする画像符号化方法。  An image encoding method comprising:
2 . 上記判定工程における判定結果に基づいて、 上記入力ビデオ素 材のプルダウン処理によるェンコ一ドの適否を表示する表示工程を さらに有することを特徴とする請求の範囲第 1項記載の画像符号化 方法。  2. The image encoding apparatus according to claim 1, further comprising a display step of displaying whether the input video material is suitable for encoding by pull-down processing based on a result of the determination in the determination step. Method.
3 . 上記判定工程は、  3. The above determination step is
上記測定されたプルダウンパターンと想定される複数の初期位相 に基づく各プルダウンパターンとを比較して、 上記各プルダウンパ ターンのうちの上記測定されたプルダウンパターンに最も近いプル ダウンパターンを与える初期位相を選択する選択工程と、  By comparing the measured pull-down pattern with each of the pull-down patterns based on a plurality of assumed initial phases, an initial phase that gives a pull-down pattern closest to the measured pull-down pattern among the pull-down patterns is determined. A selection process to select;
上記選択された初期位相に基づくプルダウンパターンの、 上記ビ デォ素材の総フレーム数に対する誤差を算出する誤差算出工程と、 上記算出された誤差に基づいて、 上記選択された初期位相に基づ くプルダウンパターンの安定度をェンコ一ド前に判定する安定度判 定工程と  An error calculating step of calculating an error of the pull-down pattern based on the selected initial phase with respect to the total number of frames of the video material, and based on the selected initial phase based on the calculated error A stability determination process for determining the stability of the pull-down pattern before encoding
を有することを特徴とする請求の範囲第 1項記載の画像符号化方 法。 2. The image encoding method according to claim 1, comprising:
4 . 上記安定度判定工程では、 上記測定されたビデオ素材のブルダ ゥンパターンと上記選択された初期位相に基づくプルダウンパ夕一 ンとのマツチング率およびエラー発生率を、 それぞれしきい値と比 較して、 上記ビデオ素材のプルダウン処理によるェンコ一ドの安定 度を判定すること 4. In the stability determination step, the matching ratio and the error occurrence ratio of the measured dull-down pattern of the video material and the pull-down pattern based on the selected initial phase are compared with threshold values, respectively. To determine the stability of the encoder by pulling down the video material
を特徴とする請求の範囲第 3項記載の画像符号化方法。  4. The image encoding method according to claim 3, wherein:
5 . 上記プルダウン処理に応じた符号化は、 上記測定されたブルダ ゥンパターンに応じて、 繰り返しフィ一ルドを符号化しないことに より行われることを特徴とする請求の範囲第 1項記載の画像符号化 方法。  5. The image code according to claim 1, wherein the coding according to the pull-down processing is performed by not coding a repetitive field according to the measured Bouland pattern. Method.
6 . 入力ビデオ素材に対して、 プルダウンパターンに基づく符号化 を施す 2パス方式の画像符号化装置において、  6. In a 2-pass image encoding device that encodes input video material based on a pull-down pattern,
上記入力ビデオ素材のプルダウンパターンを測定する測定手段と、 上記測定されたプルダウンパターンと想定される複数の初期位相 に基づく各プルダウンパターンとを比較して、 上記各プルダゥンパ ターンのうちの上記測定されたプルダウンパターンに最も近いプル ダウンパターンを与える初期位相を選択する選択手段と、  Measuring means for measuring the pull-down pattern of the input video material, and comparing the measured pull-down pattern with each of the pull-down patterns based on a plurality of assumed initial phases, and measuring the measured one of the pull-down patterns Selecting means for selecting an initial phase that gives a pull-down pattern closest to the pull-down pattern;
上記選択された初期位相に基づく プルダウンパターンの、 上記ビ デォ素材の総フレーム数に対する誤差を算出する誤差算出手段と、 上記算出された誤差に基づいて、 上記選択された初期位相に基づ くプルダウンパターンの安定度をェンコ一ド前に判定する安定度判 定手段と  Error calculating means for calculating an error of the pull-down pattern based on the selected initial phase with respect to the total number of frames of the video material, and based on the selected initial phase based on the calculated error Stability determination means for determining the stability of the pull-down pattern before encoding
を有することを特徴とする画像符号化装置。  An image encoding device comprising:
7 . 上記安定度判定手段における判定結果に基づいて、 上記入力ビ デォ素材のプルダウン処理によるェンコ一ドの適否を表示する表示 手段をさらに有することを特徴とする請求の範囲第 6項記載の画像 符号化装置。 7. A display for indicating whether the input video material is appropriate or not by the pull-down processing of the input video material based on the determination result in the stability determining means. 7. The image encoding device according to claim 6, further comprising: means.
8 . 上記安定度判定手段では、 上記測定されたビデオ素材のブルダ ゥンパターンと上記選択された初期位相に基づく プルダウンパ夕一 ンとのマッチング率およびエラー発生率を、 それぞれしきい値と比 較して、 上記ビデオ素材のプルダウン処理によるェンコ一ドの安定 度を判定することを特徴とする請求の範囲第 6項記載の画像符号化  8. The stability determining means compares a matching rate and an error occurrence rate between the measured bluedown pattern of the video material and the pull-down pattern based on the selected initial phase with threshold values, respectively. 7. The image coding method according to claim 6, wherein the stability of the encode by the pull-down processing of the video material is determined.
PCT/JP1998/005626 1997-12-12 1998-12-11 Image encoding method and device WO1999031886A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US09/374,134 US6275528B1 (en) 1997-12-12 1999-08-10 Picture encoding method and picture encoding apparatus

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP34344197A JP3740813B2 (en) 1997-12-12 1997-12-12 Image encoding method and image encoding apparatus
JP9/343441 1997-12-12

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US09/374,134 Continuation US6275528B1 (en) 1997-12-12 1999-08-10 Picture encoding method and picture encoding apparatus

Publications (1)

Publication Number Publication Date
WO1999031886A1 true WO1999031886A1 (en) 1999-06-24

Family

ID=18361545

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP1998/005626 WO1999031886A1 (en) 1997-12-12 1998-12-11 Image encoding method and device

Country Status (3)

Country Link
US (1) US6275528B1 (en)
JP (1) JP3740813B2 (en)
WO (1) WO1999031886A1 (en)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6563953B2 (en) * 1998-11-30 2003-05-13 Microsoft Corporation Predictive image compression using a single variable length code for both the luminance and chrominance blocks for each macroblock
CN100452883C (en) 2001-12-17 2009-01-14 微软公司 Skip macroblock coding
US7130472B2 (en) * 2002-01-21 2006-10-31 Canon Kabushiki Kaisha Image distribution apparatus, communication terminal apparatus, and control method thereof
US6940540B2 (en) * 2002-06-27 2005-09-06 Microsoft Corporation Speaker detection and tracking using audiovisual data
US20050013498A1 (en) 2003-07-18 2005-01-20 Microsoft Corporation Coding of motion vector information
US7623574B2 (en) * 2003-09-07 2009-11-24 Microsoft Corporation Selecting between dominant and non-dominant motion vector predictor polarities
US7606308B2 (en) * 2003-09-07 2009-10-20 Microsoft Corporation Signaling macroblock mode information for macroblocks of interlaced forward-predicted fields
US7620106B2 (en) * 2003-09-07 2009-11-17 Microsoft Corporation Joint coding and decoding of a reference field selection and differential motion vector information
US8064520B2 (en) 2003-09-07 2011-11-22 Microsoft Corporation Advanced bi-directional predictive coding of interlaced video
US7724827B2 (en) 2003-09-07 2010-05-25 Microsoft Corporation Multi-layer run level encoding and decoding
US7567617B2 (en) 2003-09-07 2009-07-28 Microsoft Corporation Predicting motion vectors for fields of forward-predicted interlaced video frames
US7616692B2 (en) * 2003-09-07 2009-11-10 Microsoft Corporation Hybrid motion vector prediction for interlaced forward-predicted fields
JP4655191B2 (en) * 2004-09-02 2011-03-23 ソニー株式会社 Information processing apparatus and method, recording medium, and program
US9077960B2 (en) * 2005-08-12 2015-07-07 Microsoft Corporation Non-zero coefficient block pattern coding
EP1848220A3 (en) * 2006-04-18 2011-09-28 Pioneer Corporation Block noise removal device
KR101484280B1 (en) * 2009-12-08 2015-01-20 삼성전자주식회사 Method and apparatus for video encoding by motion prediction using arbitrary partition, and method and apparatus for video decoding by motion compensation using arbitrary partition

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08265639A (en) * 1995-03-24 1996-10-11 Mitsubishi Electric Corp Video signal converter and re-converter
JPH09168148A (en) * 1995-09-20 1997-06-24 Sony Corp Dynamic image coding method and device and recording medium
JPH09284757A (en) * 1996-04-11 1997-10-31 Sony Corp Image coding device and method

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5461420A (en) * 1992-09-18 1995-10-24 Sony Corporation Apparatus for coding and decoding a digital video signal derived from a motion picture film source
GB9303369D0 (en) * 1993-02-19 1993-04-07 Philips Electronics Uk Ltd Identifying film frames in a video sequence
US5691771A (en) * 1994-12-29 1997-11-25 Sony Corporation Processing of redundant fields in a moving picture to achieve synchronized system operation

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08265639A (en) * 1995-03-24 1996-10-11 Mitsubishi Electric Corp Video signal converter and re-converter
JPH09168148A (en) * 1995-09-20 1997-06-24 Sony Corp Dynamic image coding method and device and recording medium
JPH09284757A (en) * 1996-04-11 1997-10-31 Sony Corp Image coding device and method

Also Published As

Publication number Publication date
US6275528B1 (en) 2001-08-14
JP3740813B2 (en) 2006-02-01
JPH11177978A (en) 1999-07-02

Similar Documents

Publication Publication Date Title
JP3465272B2 (en) Digital data recording device and recording method
JP3953574B2 (en) Program encoding apparatus and recording apparatus
WO1999031886A1 (en) Image encoding method and device
EP0861490B1 (en) Recording and reproducing system for simultaneous recording and reproduction via an information carrier
KR101242447B1 (en) Program, decoding device, decoding method, and recording medium
JP4791129B2 (en) Image coding apparatus, image coding method, and image editing apparatus
JP3911768B2 (en) Image encoding method and image encoding apparatus
JP4906344B2 (en) Audio / video recording apparatus, recording method, reproducing apparatus, and reproducing method
JP3837889B2 (en) Encoding method and encoding apparatus
JP3956394B2 (en) Audio / video data encoding apparatus and method
JP4634622B2 (en) Method and apparatus for bit rate control in a video or audio encoder
JP4244051B2 (en) Program, decoding device, decoding method, and recording medium
JP4650454B2 (en) Encoding apparatus and encoding method
JP3951152B2 (en) Image coding apparatus and method
JP4462643B2 (en) Image encoding method and image encoding apparatus
KR20000000611A (en) Detecting remaining amount of recording medium and method for compress-recording of signal according detected remaining amount and device thereof
JPH10304372A (en) Image coding method and device, and image transmission method
US20050053363A1 (en) Method of and device for encoding an information stream
JP3660514B2 (en) Variable rate video encoding method and video editing system
JPH0918830A (en) Video editing device
JP4161385B2 (en) Image encoding method and apparatus, image processing apparatus and image processing method
JPH08331556A (en) Image coder and image coding method
JPH10108200A (en) Image coding method and its device
JP3801894B2 (en) Recording method and recording apparatus for disc-shaped recording medium, and reproducing method and reproducing apparatus
JPH08111847A (en) Video recording and reproducing method

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): CA US

WWE Wipo information: entry into national phase

Ref document number: 09374134

Country of ref document: US